欢迎来到“AI Daily”版块!这里是您每天探索人工智能世界的指南。我们每天为您呈现 AI 领域的最新内容,聚焦开发者,帮助您了解技术趋势和创新 AI 产品应用。

新 AI 产品 点击获取更多信息https://app.aibase.com/zh

1. 京东物流发布“超级大脑大模型2.0”和“亿浪具身智能机器人臂系统”

京东物流在 JDDiscovery-2025 大会上发布了“超级大脑大模型 2.0”和“亿浪具身智能机器人手臂系统”,标志着物流行业从“辅助决策”转向“具身执行”。这些技术提升了物流供应链的效率,实现了智能闭环系统。

image.png

【AiBase 摘要:】

🚀京东物流发布“超级大脑大模型2.0”和“亿浪机器人臂”,推动物流行业的智能化升级。

“超级大脑大模型2.0”可在2小时内解决数百万个变量,提高物流运营效率。

🤖 “亿浪”机器人手臂具备自学习能力,能够实现对复杂包装的高精度处理。

2. DeepSeek V3.1 终端版发布:修复关键漏洞,增强稳定性,V4 新架构即将到来

DeepSeek 发布了 V3.1-Terminus 版本,显著提升了模型稳定性并修复了关键问题。同时,这个版本可能标志着 V3 系列的终结,并为即将到来的 V4 版本或 R2 重大更新铺平道路。

image.png

【AiBase 摘要:】

✅ 提升了模型稳定性,修复了中英文混合输出和异常字符的问题。

🛠️ 优化了代码代理和搜索代理模块,提高了代码生成和搜索的准确性。

🚀 表示 V4 版本或 R2 重大更新即将到来,可能包含新的架构设计。

3. Kimi 推出新代理模式“OK Computer”,开始 beta 测试

Kimi 推出了一款名为“OK Computer”的新代理模式并开始 beta 测试。此模式基于 Kimi K2 模型,支持多功能智能服务,用户只需发出要求,即可简单完成网站开发、数据分析等复杂任务。

image.png

【AiBase 摘要:】

🌟 Kimi 推出全新代理模式“OK Computer”,支持多功能智能服务。

💻 用户只需提出请求,即可完成网站开发、数据分析等复杂任务。

🚀 Kimi K2 模型在自主编程和工具调用方面表现出色,总参数量达到 1T。

4. ChatGPT 推出个性化新闻功能,您的个人新闻助手已上线!

ChatGPT 推出了个性化新闻功能,根据用户的对话历史提供定制化的每日新闻,涵盖多个领域,提高信息检索效率。

image.png

【AiBase 摘要:】

🤖 ChatGPT 根据用户聊天历史推送个性化新闻。

📰 新闻涵盖新闻、科技和经济等领域。

💡 目的是提高用户的信息检索效率和体验。

5. LLM 编码幻觉终结者!Exa Code 发布,数十亿代码索引让 AI 代理无错误

Exa Code 是一款针对编码代理优化的网络上下文工具,通过索引大量文档和代码仓库,提供高效准确的代码上下文,帮助大型语言模型避免生成错误代码。其核心创新在于准确提取相关标记,降低幻觉风险,并在多个场景中表现良好。

image.png

【AiBase 摘要:】

🔥 Exa Code 是首个专为编码代理设计的专用解决方案,增强了人工智能代理的可靠性。

💡 准确的上下文提取确保了最大信息密度,避免了长输出。

🚀 免费开源,易于集成,适用于各种编程需求,加速开发过程。

详情链接:https://exa.ai/blog/exa-code

6. Meta 推出 AI 视频生成平台 Vibes,轻松创建和分享 AI 短视频

Meta 的 Vibes 平台为用户提供便捷的 AI 视频创作工具,支持多种创作方式,并可实现跨平台分享,提升用户的创作体验。

image.png

【AiBase 摘要:】

🎬 Vibes 是一个允许用户轻松创建和分享 AI 生成短视频的平台。

🎨 用户可以使用现有素材,从头开始创作,或混搭动态内容进行创作。

📱 视频可以直接在 Vibes 发布或分享到 Instagram 和 Facebook 等平台。

详情链接:https://about.fb.com/news/2025/09/introducing-vibes-ai-videos/

7. 蚂蚁集团推出新型隐私保护 AI 算法,推理速度提升超过 100 倍

蚂蚁集团在隐私计算领域取得了重大突破,其新推出的隐私保护 AI 训练框架 Gibbon 显著提升了数据隐私和高效计算之间的平衡。

image.png

【AiBase 摘要:】

🧠 The Gibbon 框架通过创新的加密多方训练方法,提高了传统 GBDT 模型的训练速度。

🔒 基于同态查找表的隐私保护决策树推理技术,在数据隐私保护下大幅提升了计算效率。

🌐 蚂蚁集团已构建了一个多元化的隐私计算产品矩阵,为多个行业提供高安全性和高性能的解决方案。

8. OpenAI 的最新基准测试显示,GPT-5 在多个行业中逐渐接近人类专家。

OpenAI 发布了一个新的基准测试 GDPval,用于评估 AI 模型在多个行业中的表现,与人类专业人士相比。GPT-5 和 Claude Opus4.1 在某些任务中表现出与行业专家相近的性能,但它们仍然不能完全取代人类工作。该测试涵盖了九大行业和 44 个职业,并计划在未来推出更全面的测试。

image.png

【AiBase 摘要:】

🌟 OpenAI 的新基准测试 GDPval 评估了 AI 模型在多个行业的性能,逐渐接近人类专家的能力。

🤖 在 44 个职业中,GPT-5 在 40.6%的任务中表现优于或等于行业专家,而 Claude Opus4.1 达到了 49%。

📈 OpenAI 计划未来推出更全面的测试,以更准确地评估 AI 在现实世界工作中的能力和表现。

详情链接:https://openai.com/index/gdpval/