AI Daily:胜数科技发布 Vidu Q2;火龙引擎推出 Lumi;通义千文开放 300+模型 --- AI Daily Shengshu Technology Launches Vidu Q2; Huolong Engine Launches Lumi; Tongyi Qianwen Opens 300+ Models --知识铺
欢迎来到“AI Daily”专栏!这是您每天探索人工智能世界的指南。每天,我们为您呈现 AI 领域的最新内容,聚焦开发者,帮助您了解技术趋势和创新 AI 产品应用。
新 AI 产品 点击获取更多信息 :https://app.aibase.com/zh
1. 深数科技发布 Vidu Q2,通过细微表情带来更逼真的 AI 表现!
盛舒科技推出的 Vidu Q2 模型在图像到视频领域取得了重大突破,尤其是在生成细微表情方面表现出色,为 AI 表演提供了更加真实生动的视觉体验。
【AiBase 热点:】
🎭 Vidu Q2 能够准确捕捉表情的微妙变化,增强了视频生成的自然度和情感表达。
🎥 支持多种视频模式,包括图像到视频、起始结束帧视频和可调节时长选项,满足多样化需求。
💡 盛舒科技致力于通过 AI 技术推动创意产业的发展,为用户提供更高品质的音视频创作体验。
2. 火山引擎推出 Lumi 平台,支持视觉模型 Lora 微调
火山引擎推出的 Lumi 平台现在支持 Doubao 和 Jiemeng 等视觉模型的 Lora 微调,旨在帮助企业高效定制独特的视觉风格,以满足市场需求。
【AiBase 热点:】
🧠 Lumi 平台支持视觉模型的 Lora 微调,帮助企业定制独特的视觉风格。
🚀 平台提供从图像生成到视频生成的端到端服务,满足企业场景中专业 AIGC 的需求。
💡 Lumi 平台帮助企业高效构建定制化的 AIGC 生产能力,提升用户体验。
3. 阿里云 CTO 透露:通义千文开源超过 300 个模型,下载量超过 6 亿次
在 2025 云栖大会上,阿里云展示了通义千文项目的显著成果,包括开源超过 300 个模型,下载量超过 6 亿次。这展示了阿里云在 AI 领域的强大影响力和技术实力,并通过开源模型推动技术创新和应用。
【AiBase 热点:】
🚀 通义千文项目开源超过300个模型,展现了强大的技术能力。
📊 总下载量超过 6 亿次,反映了用户对阿里云 AI 技术的认可度很高。
🖼️ 通义万象已生成超过3.9亿张图片和超过7000万段视频,展示了数字内容生成能力。
4. 百度开源 Qianfan-VL,昆仑芯片助力多模态 AI 突破
百度正式开源其最新的视觉理解模型 Qianfan-VL,包括 3B、8B 和 70B 三个版本,适用于不同场景。该模型具有强大的多模态能力,尤其在 OCR 和教育领域,其训练依赖于百度自研的昆仑 P800 芯片。
【AiBase 热点:】
🧠Qianfan-VL 是一款强大的多模态大型模型,能够同时处理图像和文本信息。
💡昆仑 P800 芯片支持模型的训练,低功耗、高效率,优化大规模计算性能。
🚀 Qianfan-VL 系列已在 GitHub 和 Hugging Face 上开源,供开发者免费使用。
详情:https://github.com/baidubce/Qianfan-VL
5. 微软整合 Anthropic AI 模型,扩展 Copilot 助手功能
微软宣布将 Anthropic 的 AI 模型整合到 Copilot 助手中,标志着其在生成式 AI 领域的多元化战略迈出了新的一步。尽管微软继续与 OpenAI 保持紧密合作,但它开始采用 Anthropic 的技术以满足商业客户的需求。企业用户现在可以使用 Anthropic 的模型构建 AI 代理,这些模型将在亚马逊和谷歌云上运行。
【AiBase 热点:】
🤖 微软将 Anthropic 的 AI 模型集成到 Copilot 助手中,推动产品多样化。
🔄 虽然微软与 OpenAI 保持着紧密关系,但它正逐渐采用 Anthropic 的技术。
🚀 企业用户可以选择 Anthropic 模型来构建 AI 代理,使用前需要管理员激活。
6. OpenAI 在美国建设了五个新的数据中心,加速了 Stargate 项目。
OpenAI 宣布在美国建设五个新的数据中心,以增强星门项目的计算能力。该项目由多家公司发起,总投资额为 500 亿美元,旨在推动生成式 AI 的发展。
【AiBase 热点:】
🌐 OpenAI 将在美国建设五个新的数据中心,Stargate 项目总计算能力将达到近 7GW。
💼 Oracle 将负责建设三个新的数据中心,Abilene 数据中心将扩建并增加 600MW 的计算能力。
🚀 OpenAI 计划未来每周增加 1GW 的 AI 基础设施,以推动人工智能技术的进一步发展。
7. NVIDIA 开源 Audio2Face 模型,人工智能助力生成实时面部动画
NVIDIA 开源了其生成式 AI 面部动画模型 Audio2Face,提供支持离线和实时处理的 SDK 和训练框架,适用于游戏、电影和其他领域。这项技术已被多个游戏开发者采用,提升了角色的真实感和沉浸式体验。
【AiBase 热点:】
🔊 NVIDIA 开源 Audio2Face 模型,提升虚拟角色面部动画生成技术。
🎮 支持离线渲染和实时流处理,适用于各种场景。
🌟 已被多家游戏开发者采用,简化制作流程并增强角色真实感。
详情:https://build.nvidia.com/nvidia/audio2face-3d
8. Meta 发布代码世界模型 CWM:一款具有沙盒模拟能力的 32B AI
Meta 的代码世界模型(CWM)是一个拥有 32B 参数的 AI 系统,它可以通过沙盒环境模拟和推理代码,减少错误并提高调试效率。该模型需要高硬件规格,需要双 H100 GPU 和 RDMA 技术支持。
【AiBase 热点:】
🧠 CWM 在生成代码之前在沙盒环境中模拟代码,预测代码执行的结果。
🔍 它可以快速识别代码错误,提高调试效率。
🚨 可在执行命令前预警潜在风险,增强安全性。
详情:https://github.com/facebookresearch/cwm
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai002/post/20251020/AI-Daily%E8%83%9C%E6%95%B0%E7%A7%91%E6%8A%80%E5%8F%91%E5%B8%83-Vidu-Q2%E7%81%AB%E9%BE%99%E5%BC%95%E6%93%8E%E6%8E%A8%E5%87%BA-Lumi%E9%80%9A%E4%B9%89%E5%8D%83%E6%96%87%E5%BC%80%E6%94%BE-300+%E6%A8%A1%E5%9E%8B---AI-Daily-Shengshu-Technology-Launches-Vidu-Q2-Huolong-Engine-Launches-Lumi-Tongyi-Qianwen-Opens-300+-Models/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com
See Also
- AI Daily:京东物流发布超级大脑大模型 2.0;DeepSeek V3.1 最终版发布;Kimi 推出新代理模式 --- AI Daily JD Logistics Launches Super Brain Large Model 2.0; DeepSeek V3.1 Final Version Released; Kimi Launches New Agent --知识铺
- AI Daily:腾讯发布环渊图像 3.0;快手推出 KAT 系列代理编码大型模型;苹果悄然开发类似 ChatGPT 的应用 --- AI Daily Tencent Unveils Huan Yuan Image 3.0; Kuaishou Launches KAT Series Agentic Coding Large Model; Apple Quietly D --知识铺
- AI Daily:DeepSeek 发布 V3.2-exp 模型;Claude Sonnet 4.5 发布;ChatGPT 推出即时结账功能 --- AI Daily DeepSeek Releases V3.2-exp Model; Claude Sonnet 4.5 Released; ChatGPT Launches Instant Checkout Featu --知识铺
- AI Daily:阿里巴巴发布紧凑型 Qwen3-VL 模型;科大讯飞 AI 翻译耳机全球上市;Gemini 代码出现在 Veo3.1 --- AI Daily Alibaba Launches Compact Qwen3-VL Model; iFlytek AI Translation Earbuds Launch Globally; Gemini Code App --知识铺
- AI Daily:阿里巴巴发布多模态模型 Qwen3-Omni;谷歌发布 AP2 协议;百度发布千帆-VL 模型 --- AI Daily Alibaba Launches Multimodal Model Qwen3-Omni; Google Unveils AP2 Protocol; Baidu Launches Qianfan-VL Model --知识铺