AI Daily：京东物流发布超级大脑大模型 2.0；DeepSeek V3.1 最终版发布；Kimi 推出新代理模式 --- AI Daily JD Logistics Launches Super Brain Large Model 2.0; DeepSeek V3.1 Final Version Released; Kimi Launches New Agent --知识铺

欢迎来到“AI Daily”版块！这里是您每天探索人工智能世界的指南。我们每天为您呈现 AI 领域的最新内容，聚焦开发者，帮助您了解技术趋势和创新 AI 产品应用。

新 AI 产品 点击获取更多信息 ：https://app.aibase.com/zh

1. 京东物流发布“超级大脑大模型2.0”和“亿浪具身智能机器人臂系统”

京东物流在 JDDiscovery-2025 大会上发布了“超级大脑大模型 2.0”和“亿浪具身智能机器人手臂系统”，标志着物流行业从“辅助决策”转向“具身执行”。这些技术提升了物流供应链的效率，实现了智能闭环系统。

【AiBase 摘要：】

🚀京东物流发布“超级大脑大模型2.0”和“亿浪机器人臂”，推动物流行业的智能化升级。

“超级大脑大模型2.0”可在2小时内解决数百万个变量，提高物流运营效率。

🤖 “亿浪”机器人手臂具备自学习能力，能够实现对复杂包装的高精度处理。

2. DeepSeek V3.1 终端版发布：修复关键漏洞，增强稳定性，V4 新架构即将到来

DeepSeek 发布了 V3.1-Terminus 版本，显著提升了模型稳定性并修复了关键问题。同时，这个版本可能标志着 V3 系列的终结，并为即将到来的 V4 版本或 R2 重大更新铺平道路。

【AiBase 摘要：】

✅ 提升了模型稳定性，修复了中英文混合输出和异常字符的问题。

🛠️ 优化了代码代理和搜索代理模块，提高了代码生成和搜索的准确性。

🚀 表示 V4 版本或 R2 重大更新即将到来，可能包含新的架构设计。

3. Kimi 推出新代理模式“OK Computer”，开始 beta 测试

Kimi 推出了一款名为“OK Computer”的新代理模式并开始 beta 测试。此模式基于 Kimi K2 模型，支持多功能智能服务，用户只需发出要求，即可简单完成网站开发、数据分析等复杂任务。

【AiBase 摘要：】

🌟 Kimi 推出全新代理模式“OK Computer”，支持多功能智能服务。

💻 用户只需提出请求，即可完成网站开发、数据分析等复杂任务。

🚀 Kimi K2 模型在自主编程和工具调用方面表现出色，总参数量达到 1T。

4. ChatGPT 推出个性化新闻功能，您的个人新闻助手已上线！

ChatGPT 推出了个性化新闻功能，根据用户的对话历史提供定制化的每日新闻，涵盖多个领域，提高信息检索效率。

【AiBase 摘要：】

🤖 ChatGPT 根据用户聊天历史推送个性化新闻。

📰 新闻涵盖新闻、科技和经济等领域。

💡 目的是提高用户的信息检索效率和体验。

5. LLM 编码幻觉终结者！Exa Code 发布，数十亿代码索引让 AI 代理无错误

Exa Code 是一款针对编码代理优化的网络上下文工具，通过索引大量文档和代码仓库，提供高效准确的代码上下文，帮助大型语言模型避免生成错误代码。其核心创新在于准确提取相关标记，降低幻觉风险，并在多个场景中表现良好。

【AiBase 摘要：】

🔥 Exa Code 是首个专为编码代理设计的专用解决方案，增强了人工智能代理的可靠性。

💡 准确的上下文提取确保了最大信息密度，避免了长输出。

🚀 免费开源，易于集成，适用于各种编程需求，加速开发过程。

详情链接：https://exa.ai/blog/exa-code

6. Meta 推出 AI 视频生成平台 Vibes，轻松创建和分享 AI 短视频

Meta 的 Vibes 平台为用户提供便捷的 AI 视频创作工具，支持多种创作方式，并可实现跨平台分享，提升用户的创作体验。

【AiBase 摘要：】

🎬 Vibes 是一个允许用户轻松创建和分享 AI 生成短视频的平台。

🎨 用户可以使用现有素材，从头开始创作，或混搭动态内容进行创作。

📱 视频可以直接在 Vibes 发布或分享到 Instagram 和 Facebook 等平台。

详情链接：https://about.fb.com/news/2025/09/introducing-vibes-ai-videos/

7. 蚂蚁集团推出新型隐私保护 AI 算法，推理速度提升超过 100 倍

蚂蚁集团在隐私计算领域取得了重大突破，其新推出的隐私保护 AI 训练框架 Gibbon 显著提升了数据隐私和高效计算之间的平衡。

【AiBase 摘要：】

🧠 The Gibbon 框架通过创新的加密多方训练方法，提高了传统 GBDT 模型的训练速度。

🔒 基于同态查找表的隐私保护决策树推理技术，在数据隐私保护下大幅提升了计算效率。

🌐 蚂蚁集团已构建了一个多元化的隐私计算产品矩阵，为多个行业提供高安全性和高性能的解决方案。

8. OpenAI 的最新基准测试显示，GPT-5 在多个行业中逐渐接近人类专家。

OpenAI 发布了一个新的基准测试 GDPval，用于评估 AI 模型在多个行业中的表现，与人类专业人士相比。GPT-5 和 Claude Opus4.1 在某些任务中表现出与行业专家相近的性能，但它们仍然不能完全取代人类工作。该测试涵盖了九大行业和 44 个职业，并计划在未来推出更全面的测试。

【AiBase 摘要：】

🌟 OpenAI 的新基准测试 GDPval 评估了 AI 模型在多个行业的性能，逐渐接近人类专家的能力。

🤖 在 44 个职业中，GPT-5 在 40.6%的任务中表现优于或等于行业专家，而 Claude Opus4.1 达到了 49%。

📈 OpenAI 计划未来推出更全面的测试，以更准确地评估 AI 在现实世界工作中的能力和表现。

详情链接：https://openai.com/index/gdpval/

文章目录

AI Daily：京东物流发布超级大脑大模型 2.0；DeepSeek V3.1 最终版发布；Kimi 推出新代理模式 --- AI Daily JD Logistics Launches Super Brain Large Model 2.0; DeepSeek V3.1 Final Version Released; Kimi Launches New Agent --知识铺

See Also

最近文章

福利派送

分类

标签

友情链接

其它