AI Daily:阿里巴巴发布多模态模型 Qwen3-Omni;谷歌发布 AP2 协议;百度发布千帆-VL 模型 --- AI Daily Alibaba Launches Multimodal Model Qwen3-Omni; Google Unveils AP2 Protocol; Baidu Launches Qianfan-VL Model --知识铺
欢迎来到“AI Daily”版块!这是您每天探索人工智能世界的指南。每天,我们为您呈现 AI 领域的最新内容,聚焦开发者,帮助您了解技术趋势和创新 AI 产品应用。
新鲜 AI 产品 点击了解更多 :https://app.aibase.com/zh
1. 阿里云发布全球首个全模态 AI 模型 Qwen3-Omni,实现文本、图像、音频和视频的统一处理
阿里云发布了 Qwen3-Omni,这是全球首个支持文本、图像、音频和视频统一处理的原生端到端全模态 AI 模型。该模型在多个领域展示了先进的跨模态性能,并开源,满足全球用户的多语言需求。
AiBase 精选:
🌟 Qwen3-Omni 是全球首个原生端到端全模态 AI 模型,支持统一处理文本、图像、音频和视频。
🌐 该模型支持 119 种文本语言和 19 种语音输入,满足全球用户的多语言需求。
🖼️ 新发布的 Qwen-Image-Edit-2509 支持多图像编辑,显著提高了编辑的一致性和有效性。
详情:https://github.com/QwenLM/Qwen3-Omni huggingface: https://huggingface.co/collections/Qwen/qwen3-omni-68d100a86cd0906843ceccbe
2. 告别图片编辑烦恼!阿里巴巴的 Qwen-Image 多图编辑功能一键打造专业广告电影
文章介绍了阿里巴巴 AI 图像编辑工具 Qwen-Image 的重大功能升级,包括新的多图编辑功能、引入 ControlNet 关键点图技术以及应用场景扩展到表情包创作,为电商和数字营销行业提供更高效的解决方案。
AiBase 突出亮点:
🖼️ 新的多图编辑功能支持人+人、人+产品、人+场景的灵活组合。
⚙️ 引入 ControlNet 关键点映射功能,提高人体姿态控制的准确性。
🛒 扩展应用场景,支持表情包创作,助力电商和营销行业。
详情:https://chat.qwen.ai/?inputFeature=image_edit
3. 百度发布千帆-VL 模型,多种尺寸满足不同场景
百度智能云千帆团队发布了新的视觉理解模型千帆-VL,包括 3B、8B 和 70B 三个版本,深度优化适用于企业级多模态应用。千帆-VL 在 OCR、教育场景和数学问题解决方面表现良好,在基准测试中展现出卓越的通用能力和在特定任务中的出色表现。
AiBase 精选:
🧠 多种尺寸的模型满足不同场景需求。
📊 8B 和 70B 模型具备思考和推理能力。
📄 在 OCR 和文档理解方面表现出色。
详情:https://baidubce.github.io/Qianfan-VL/
4. 谷歌发布 AP2 协议,与 PayPal 合作开启人工智能支付新时代
谷歌的 AP2 协议为人工智能支付提供了一个安全可靠的框架,通过授权令牌机制确保交易的法律性和安全性,同时与 PayPal 合作推动支付领域的人工智能创新和应用。
AiBase 精选:
🛒 AP2 协议为人工智能支付提供安全的授权机制,确保交易合法性。
🤝 谷歌与 PayPal 合作,推广人工智能在支付领域的实际应用。
🔒 授权令牌系统明确责任划分,增强交易透明度。
详情:https://github.com/google-agentic-commerce/AP2
5. 苹果扩展图像生成平台:Image Playground 将引入更多第三方 AI 模型
苹果在 macOS Tahoe26、iPadOS26 和 iOS26 中对 Image Playground 进行了重大更新,引入了 ChatGPT 作为图像生成模型,并计划支持更多第三方模型,例如谷歌的 Gemini2.5Flash Image。
AiBase 亮点:
🍎 苹果将图像游乐场扩展到支持更多第三方 AI 模型,包括 OpenAI 和谷歌的 Gemini2.5Flash Image。
⚙️ 添加了“估计延迟”指标和“提供商标标识”,表明苹果正在优化模型选择机制。
🔒 苹果可能更倾向于与外部合作伙伴合作,而不是直接支持开源模型,以确保图像生成工具的安全性。
6. 一键变身学习机!百度搜索推出 AI 学习伴侣
百度推出 AI 学习伴侣,利用 AI 技术将普通手机转变为学习机,为学生提供精准练习、口语训练等功能,助力促进教育公平和资源普及。
AiBase 亮点:
📚 AI 学习伴侣利用 AI 技术将普通手机转变为学习机,提升教育公平。
🗣️ 提供人工智能语音、作文批改等工具,帮助学生实现个性化学习。
🌍 百度教育团队利用文心4.5技术推动教育资源的整合和普及。
7. 钉钉 AI 表格助手正式上线:一句话生成表格,打造企业级 AI 应用平台
钉钉推出 AI 表格助手,将 AI 表格升级为 AI 时代的应用创作平台。用户只需升级到最新版本即可体验这一新功能。AI 表格助手支持对想法的自然语言描述,自动生成表格、自动化工作流和数据分析仪表板,大幅降低使用门槛。
AiBase 亮点:
✨ AI 表格助手支持对想法的自然语言描述,自动生成表格、自动化工作流和数据分析仪表板。
🚀 介绍现场特工,新增 30 名特工,支持多模态 AI 能力,如 AI 视频理解和数字人。
🌐 支持跨平台工作流程,新增对百链和 Coze 等平台工作流程的支持,实现跨平台数据聚合和分析。
8. DeepSeek-V3.1-Terminus 发布:性能全面升级,深度推理能力显著增强
DeepSeek 发布了 DeepSeek-V3.1-Terminus 模型并将其开源。与之前版本相比,该模型解决了语言不一致和异常字符等问题,优化了编程和搜索代理的性能。基准测试数据显示,其性能提升了 0.2%至 36.5%,尤其在高难度知识、多模态和深度推理方面表现出色。
AiBase 亮点:
🧠 DeepSeek-V3.1-Terminus 模型性能全面升级,提升范围 0.2%-36.5%
🚀 优化了编程和搜索代理的性能,解决了之前版本中的语言不一致问题
🔍 HLE 测试中表现出色,展现出强大的深度推理和多模态处理能力
详情:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
9. Kimi 代理会员服务惊喜上线!捐赠变 9 个月 VIP,49 元享受超级价值 AI 深度研究
Kimi 推出新的代理会员服务,为早期捐赠者提供额外福利,并通过以音乐节奏命名的会员体系展现了品牌创意。深度研究功能基于自有模型,提供专业见解,推动 AI 助手向智能代理的进化。
AiBase 精选:
✨ Kimi 推出代理会员服务,捐赠用户可额外获得会员时间。
🎵 会员系统以古典音乐节奏术语命名,融合艺术与科技。
🔍 基于自有模型的深度研究功能,提供多维视角和认知发现。
10. 全球首个通用具身智能模型开源!智元机器人 GO-1 震撼市场
智元机器人宣布,其 GO-1 通用具身基础模型已完全开源,成为全球首个采用 ViLLA 架构的具身智能模型,能够理解和执行复杂任务。此举将推动具身智能的应用和研究,降低技术门槛,吸引更多开发者参与生态建设,促进跨领域创新与合作。
AIBase 精选:
🤖 GO-1 是采用 ViLLA 架构的全球首个具身智能模型,结合了视觉、语言和潜在行动能力。
💡开源 GO-1 将促进具身智能的应用和研究,降低技术门槛。
🌐智源机器人希望吸引更多开发者参与具身智能生态系统,推动跨领域创新与合作。
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai002/post/20251020/AI-Daily%E9%98%BF%E9%87%8C%E5%B7%B4%E5%B7%B4%E5%8F%91%E5%B8%83%E5%A4%9A%E6%A8%A1%E6%80%81%E6%A8%A1%E5%9E%8B-Qwen3-Omni%E8%B0%B7%E6%AD%8C%E5%8F%91%E5%B8%83-AP2-%E5%8D%8F%E8%AE%AE%E7%99%BE%E5%BA%A6%E5%8F%91%E5%B8%83%E5%8D%83%E5%B8%86-VL-%E6%A8%A1%E5%9E%8B---AI-Daily-Alibaba-Launches-Multimodal-Model-Qwen3-Omni-Google-Unveils-AP2-Protocol-Baidu-Launches-Qianfan-VL-Model/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com
See Also
- AI Daily:谷歌发布 Veo 3.1;同义千文推出 Qwen 聊天记忆功能;Sora2 免费用户可生成 15 秒视频 --- AI Daily Google Releases Veo 3.1; Tongyi Qianwen Introduces Qwen Chat Memory Feature; Sora2 Free Users Can Generate 15- --知识铺
- AI Daily:Ant 开源高性能思考模型 Ring-flash-2.0;通义 7 模型占据 Hugging Face 主导地位;Veo3 视觉能力升级 --- AI Daily Ant Open Sources High-Performance Thinking Model Ring-flash-2.0; Tongyi's 7 Models Dominate Hu --知识铺
- AI Daily:美图 RoboNeo 首月 MAU 突破百万;高品质音视频同步模型 Gaga AI 发布;vivo 蓝心 3B 端到端大模型发布 --- AI Daily Meitu's RoboNeo Achieves Over a Million MAU in First Month; High-Quality Audio-Visual Synchronizat --知识铺
- AI Daily:美团发布推理大模型 LongCat-Flash-Thinking;阿里巴巴万维动画开源;字节跳动发布多宝翻译大模型 --- AI Daily Meituan Launches Inference Large Model LongCat-Flash-Thinking; Alibaba Wan-Animate Open-Sourced; ByteDanc --知识铺
- OpenAI 暂停Sora生成马丁・路德・金视频,保护历史人物形象 --知识铺