欢迎来到“AI Daily”版块!这是您每天探索人工智能世界的指南。每天,我们为您呈现人工智能领域的最新内容,重点关注开发者,帮助您了解技术趋势和创新的人工智能产品应用。

新鲜 AI 产品 点击了解更多https://app.aibase.com/zh

1. DeepSeek 发布 V3.2-exp 模型,引入突破性的稀疏注意力机制,将 API 成本降低一半

DeepSeek 发布了一款名为 V3.2-exp 的新实验性模型,通过创新的“稀疏注意力”机制,显著降低了长上下文操作的代价。该模型结合了“闪电索引器”和“细粒度令牌选择系统”,提高了处理长上下文段落的效率,初步测试中 API 调用成本降低了 50%。

image.png

AiBase 摘要:

⚡ DeepSeek 发布了 V3.2-exp 模型,采用稀疏注意力机制优化长上下文处理。

🔍 雷电索引器和细粒度令牌选择系统协同工作,提高模型效率。

💰 初步测试显示 API 调用成本降低了 50%,为人工智能应用提供更经济的解决方案。

2. Anthropic 做出重大举措!Claude Sonnet4.5 超越 GPT-5,成为编程领域的新的王者

Anthropic 发布了 Claude Sonnet4.5 模型,该模型在编程任务和复杂任务处理方面表现出色,成为目前最好的编程模型之一。其性能提升显著,支持多平台使用,并增强了安全性和一致性。

image.png

AiBase 总结:

✅ Claude Sonnet4.5 在编程基准测试中表现良好,实现了超过 30 小时的自主工作时间。

🔧 新增功能如检查点、上下文编辑和记忆工具,提高了开发效率和实用性。

🔒 强调安全性,减少风险行为,适用于高风险企业场景。

3. ChatGPT:聊天购物!电商 AI 革命:一键下单,无需切换浏览器

ChatGPT 推出了“即时结账”功能,允许用户在聊天界面直接完成单件商品的购买,无需跳转至链接或浏览器。此功能由 OpenAI 和 Stripe 开发的“代理商业协议”提供支持,支持多种支付方式,并将扩展到多件商品购物车和国际市场。

image.png

AiBase 总结:

💡 ChatGPT 推出“即时结账”功能,允许在聊天界面直接下单。

🔒 “代理商业协议”确保安全、简单的交易,兼容多种支付方式。

🌐 未来将扩展到多件商品购物车和国际市场,提升用户体验。

4. OpenAI 将推出 TikTok 的 AI 版本:全网所有由 AI 创建的内容

OpenAI 将推出基于 Sora2 模型的社交应用,名为“AI 版 TikTok”,其中所有内容均由 AI 生成。该应用的设计与 TikTok 类似,但将视频时长限制为 10 秒,并支持用户身份验证和竖屏使用。此外,OpenAI 专注于安全和版权问题,以提升用户体验并防止用户流失。

image.png

AiBase 总结:

🎥 Sora2 生成时长限制在 10 秒内的视频,专注于简洁内容传播。

🔒 用户可以验证自己的身份,Sora2 可以使用他们的肖像进行视频生成,允许其他用户标记他们。

🛡️ OpenAI 将发送提醒,确保用户在使用其肖像时有所了解,同时解决版权问题。

5. Claude Code 2.0 超越预期:检查点+VS Code 插件,编程效率提高三倍

Anthropic 发布了 Claude Code v2.0 和 Claude Sonnet4.5 模型的更新,显著提升了 AI 在编程中的自主性和集成度。Claude Code 通过检查点机制、终端和 IDE 优化以及为开发者提供的 API 扩展,改善了开发体验。

image.png

AiBase 总结:

✅ Claude Code v2.0 引入了检查点功能,允许 AI 自动保存状态并支持回滚,增强开发安全性。

🔧 VS Code 原生扩展进入测试阶段,提供内联差异预览和图形交互,以提高协作效率。

📈Sonnet4.5 在 OSWorld 基准测试中获得了 61.4 分,表现异常出色,尤其是在构建复杂代理系统方面。

6. 百度地图升级小度思考2.0:智能出行助手全面进化

百度地图在第七届世界新能源汽车大会上发布了小度思考2.0,本版本是首个行业端到端语音语言大模型深度集成,为用户提供更智能、更个性化的出行服务。其核心优势包括:引入地图出行知识库和实时搜索数据,提升对复杂出行意图的理解;构建跨端记忆,实现多设备无缝连接;具备即时、近期和长期记忆能力,提供个性化推荐服务。

image.png

AiBase 总结:

🚗 百度地图推出地图旅行知识库和实时搜索数据,提升了对复杂旅行意图的理解和推理能力。

📱 跨端记忆实现手机、车载系统等场景的无缝连接,提升用户体验。

🧠 智能助手具备即时、近期和长期记忆能力,提供个性化推荐服务。

7. 蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview

蚂蚁集团的 Ring-1T-preview 是全球首个开源的万亿参数推理大模型,在多项测试中表现出色,超越了几个已知的开源模型,接近 GPT-5。该模型在自然语言推理和代码生成方面展现出强大的能力,团队正在进行进一步训练以探索其潜力。

image.png

AiBase 总结:

🌟 全球首个开源万亿参数推理大型模型,Ring-1T-preview,已发布。

🚀 在 AIME25 和 CodeForces 测试中表现良好,接近 GPT-5 的水平。

🧠 团队正在进行模型训练后的优化,以增强其自然语言推理能力。

8. DeepMind 推出“框架链”概念:视频模型可能实现全面视觉理解

DeepMind 的“帧链”(CoF)概念为视频生成模型带来了突破性进展。这项技术使视频模型能够在时间和空间上进行推理,展现出与语言模型相似的一般能力。Veo3 模型在多个视觉任务中表现良好,展示了强大的感知、建模和控制能力。

image.png

AiBase 总结:

🎥 框架链技术使视频模型具备跨时间和空间推理能力,提升视频生成智能水平。

🧠 Veo3 模型展现出强大的通用视觉能力,能够处理各种未经训练的任务。

🚀 DeepMind 预测,未来的通用视频模型可能取代专用模型,推动机器视觉进入新时代。

详情链接:https://papers-pdfs.assets.alphaxiv.org/2509.20328v1.pdf