AI Daily:微软发布其首个自研图像生成模型 MAI-Image-1;百度世界大会日期公布;AI 专家开源 Nanochat 教学工具 --- AI Daily Microsoft Launches Its First Self-Developed Image Generation Model MAI-Image-1; Baidu World Conference --知识铺
欢迎来到“AI Daily”版块!这是您每天探索人工智能世界的指南。我们每天为您呈现 AI 领域的最新内容,重点关注开发者,帮助您了解技术趋势和创新 AI 产品应用。
新鲜 AI 产品 点击了解更多 :https://app.aibase.com/zh
1. 微软发布其首个自研图像生成模型 MAI-Image-1,在 LMArena 排名前十
微软 AI 正式发布了其首个完全自主研发的图像生成模型 MAI-Image-1,该模型在 LMArena 排名前十,展示了卓越的图像生成能力。MAI-Image-1 专注于实用应用价值,避免重复或单调的图像生成,同时在光影效果和自然景观方面表现出色,结合速度和质量以提高创作效率。微软团队还在 LMArena 对该模型进行了测试,以确保安全使用,并计划将其应用于 Copilot 和 Bing 图像创建器,为用户提供更强大的创作工具。
【AiBase 摘要:】
🌟 首个自研模型:MAI-Image-1 是微软首个完全自研的图像生成模型。
⚡ 高质量与快速迭代:该模型在生成逼真图像方面表现卓越,结合速度与质量以提升创作效率。
🛡️ 安全负责任的应用:微软团队在 LMArena 上测试了该模型以确保其安全使用,并期望它能在更多平台上可用。
详情链接:https://microsoft.ai/news/introducing-mai-image-1-debuting-in-the-top-10-on-lmarena/
2. 百度世界 2025 将于 11 月 13 日举行:聚焦大模型技术、AI 原生应用和全球战略
百度世界 2025 将聚焦大模型技术、AI 原生应用和全球战略,展示百度在人工智能领域的专业技术优势及未来布局。
【AiBase 摘要:】
🧠 百度将展示其在大模型技术领域的最新进展和技术积累。
💡 专注于构建 AI 原生应用生态系统,推动数字化转型。
🌍 展示百度全球扩张战略,探索国际市场增长潜力。
3. Meta 的超级智能实验室发布新技术,RAG 推理速度提升 30 倍
Meta 公司成立了新的超级智能实验室(MSL)并发布了其首篇重要论文《REFRAG:基于 RAG 的解码再思考》,显著提高了检索增强生成(RAG)任务中大型语言模型的推理速度,提升了 30 倍以上。这项研究通过信息压缩和持续预训练方法提高了模型的效率和准确性,为人工智能领域的发展注入了新的动力。
【AiBase 摘要:】
🧠 Meta 建立了超级智能实验室,推动人工智能技术的发展。
⚡ 新论文“REFRAG”将 RAG 推理速度提高了 30 倍,降低了计算需求。
🚀 REFRAG 框架通过信息压缩提高了大型语言模型的效率和准确性。
详情链接:https://arxiv.org/abs/2509.01092
4. 用 100 美元打造自己的 ChatGPT:AI 专家开源 nanochat 教学工具,从零开始 4 小时打造聊天机器人
nanochat 是一个全新的开源项目,允许普通开发者和 AI 爱好者以极低的成本构建一个功能齐全的聊天 AI 系统。该项目实现了从数据处理到部署的一键过程,使用简单的代码栈,大大降低了技术门槛。
【AiBase 摘要:】
🔥 nanochat 提供一套完整的教学工具,帮助用户深入理解大型语言模型的训练过程。
💡 该项目涵盖模型训练、微调、评估和交互式部署,支持分布式高效加载。
🚀 用户只需启动一个云节点并运行一个脚本,即可在4小时内完成整个流程。
详情链接:https://github.com/karpathy/nanochat
5. Google NotebookLM 推出动漫视频功能:Nano Banana 一键生成六种艺术风格,中文支持仍需优化
Google 的 NotebookLM 工具最近进行了更新,新增了动漫视频功能。用户可以使用 Nano Banana 图像生成模型将文档转换为生动视频,并选择各种艺术风格。尽管功能强大,但中文支持仍存在不足,例如方言混淆和同步问题。
【AiBase 摘要:】
✨ Google NotebookLM 新增动漫视频功能,提升了内容创作的乐趣。
🎨 支持包括水彩、复古印刷和日式动漫卡通风格在内的六种艺术风格。
⚠️ 中文支持存在语言处理问题,需要进一步优化以适应多语言环境。
6. 中国农业大学发布神农大模型 3.0,AI 助力乡村振兴
中国农业大学在 2025 年世界农业科学与技术创新大会上发布了神农大模型 3.0。该模型涵盖国家农业学科和应用场景,标志着中国农业 AI 技术进入新阶段。神农大模型 3.0 通过引入 32B、7B 和 1B 版本,显著提高了计算效率,并将计算能力降低了 50%。同时,团队还发布了“神农大模型智能体平台”,构建新的 AI 应用生态,进一步推动农业 AI 技术向更高水平的“系统智能”发展。
【AiBase 摘要:】
🌱神农大模型 3.0 覆盖国家农业学科和应用场景,标志着中国农业 AI 技术进入新阶段。
🚀神农大模型 3.0 推出 32B、7B 和 1B 版本,提高计算效率,降低计算功率 50%。
🌍中国农业大学团队推出“神农大模型智能体平台”,构建新的 AI 应用生态。
7. 腾讯聚焦 AI 人才培养:青云奖学金第一期资助 15 名优秀硕士和博士研究生,提供稀缺计算资源
腾讯宣布推出“青云奖学金”,专注于人工智能领域的根本研究和应用创新,旨在支持计算机科学、人工智能及其交叉学科的优秀硕士和博士研究生。第一期计划将选出15位获奖者,每人获得50万元人民币现金和计算资源,以解决研究中的计算瓶颈。这项奖学金是腾讯人才计划的重要组成部分,进一步提升了其综合人才培养体系。
【AiBase 摘要:】
🧠 腾讯的“青云奖学金”专注于人工智能领域,支持硕士和博士研究生的研究工作。
💰 第一期资助了15位获奖者,每人获得50万元人民币现金和计算资源。
🚀 该奖学金旨在提升腾讯的人才培养体系,提供导师指导、实验室访问等机会。
8. 苹果推出新 FS-DFM 模型,AI 长文本写作效率提升 128 倍!
苹果公司与俄亥俄州立大学研究团队共同发布的 FS-DFM 模型在长文本生成方面表现出色,仅需 8 次快速迭代即可生成高质量文本,写作速度提高至 128 倍,打破了长文本生成中的效率瓶颈。该模型通过三个步骤优化迭代机制,在文本生成的困惑度和熵等关键指标上优于其他大型模型,展示了其在 AI 长文本写作领域的潜力。
【AiBase 摘要:】
🍎 FS-DFM 模型仅需 8 次迭代即可生成与传统模型数千次迭代相当的质量。
🚀 写作速度提高至最高128倍,大幅提升了长文本生成的效率。
🔍 性能测试显示,FS-DFM 在困惑度和熵等关键指标上优于其他大型模型。
详情链接:https://machinelearning.apple.com/research/fs-dfm
9. Google Lens 和 AI 模式推出 Nano Banana 图像编辑功能
谷歌正式推出了 Nano Banana 图像编辑功能,在 Gemini 应用中获得了良好的反馈。此功能集成到 AI 模式和 Google Lens 中,使用户能够更方便地编辑和生成图像。目前,该功能已向美国和印度的 Android 和 iOS 用户开放,并计划扩展到更多国家和地区。
【AiBase 摘要:】
📱 AI 模式与 Google Lens 集成,提升图像捕捉和编辑体验。
🌍 增加对 35 种语言和 40 个国家的支持,扩大 AI 模式的覆盖范围。
🎨 用户可以使用香蕉表情符号创建或编辑图像,并带有 Gemini 水印。
10. 香港大学与美团联合解决 AI 数学问题:CodePlot-CoT 让大型模型学会用代码思考,性能提升 21%
文章介绍了香港大学和美团团队提出的 CodePlot-CoT 方法,该方法通过生成绘图代码使大型模型能够解决数学几何问题。这种方法将图像生成问题转化为语言建模问题,提高了大型模型在数学推理方面的性能。
【AiBase 摘要:】
📌 CodePlot-CoT 通过生成绘图代码解决数学几何问题,增强推理能力。
💡 Math-VR 数据集要求模型积极绘图和思考,促进多模态数学推理的发展。
📈实验结果显示,CodePlot-CoT 在 Math-VR 基准测试中的性能提高了高达 21%。
详情链接:https://arxiv.org/pdf/2510.11718
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai002/post/20251020/AI-Daily%E5%BE%AE%E8%BD%AF%E5%8F%91%E5%B8%83%E5%85%B6%E9%A6%96%E4%B8%AA%E8%87%AA%E7%A0%94%E5%9B%BE%E5%83%8F%E7%94%9F%E6%88%90%E6%A8%A1%E5%9E%8B-MAI-Image-1%E7%99%BE%E5%BA%A6%E4%B8%96%E7%95%8C%E5%A4%A7%E4%BC%9A%E6%97%A5%E6%9C%9F%E5%85%AC%E5%B8%83AI-%E4%B8%93%E5%AE%B6%E5%BC%80%E6%BA%90-Nanochat-%E6%95%99%E5%AD%A6%E5%B7%A5%E5%85%B7---AI-Daily-Microsoft-Launches-Its-First-Self-Developed-Image-Generation-Model-MAI-Image-1-Baidu-World-Conference/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com
See Also
- AI Daily:LiblibAI 2.0 正式发布;通义千文、多宝启用记忆功能;Sora 现已可在 Google Play 上使用 --- AI Daily LiblibAI 2.0 Officially Launches; Tongyi Qianwen, Doubao Enable Memory Function; Sora Now Available on Go --知识铺
- AI Daily:快手 KAT-Dev 代码模型开源并排名首位;全球首款 IP66 防护型人形机器人 DR02 发布;谷歌 Chrome 将推出新 Gemini 功能 --- AI Daily Kuaishou KAT-Dev Code Model Open Sourced and Ranks at the Top; World's First IP66 Protec --知识铺
- AI Daily:谷歌 Gemini 3.0 Pro 正在小规模推广;爱数科技完成 1 亿元 B+轮融资;百度发布文档解析模型 PaddleOCR-VL --- AI Daily Google Gemini 3.0 Pro is being rolled out on a limited scale; Aishike Technology completes B+ r --知识铺
- AI Daily:Veo 3.1 可生成 1 分钟视频;蚂蚁发布 1 万亿参数语言模型 Ling-1T;Lovart 提供 Sora2 免费访问 --- AI Daily Veo 3.1 Can Generate 1-Minute Videos; Ant Unveils a 1 Trillion Parameter Language Model Ling-1T; Lo --知识铺
- AI Daily:胜数科技发布 Vidu Q2;火龙引擎推出 Lumi;通义千文开放 300+模型 --- AI Daily Shengshu Technology Launches Vidu Q2; Huolong Engine Launches Lumi; Tongyi Qianwen Opens 300+ Models --知识铺