欢迎来到“AI Daily”专栏!这是您每天探索人工智能世界的指南。每天,我们为您呈现 AI 领域的最新内容,聚焦开发者,帮助您了解技术趋势和创新 AI 产品应用。

新 AI 产品 点击获取更多信息https://app.aibase.com/zh

1. 深数科技发布 Vidu Q2,通过细微表情带来更逼真的 AI 表现!

盛舒科技推出的 Vidu Q2 模型在图像到视频领域取得了重大突破,尤其是在生成细微表情方面表现出色,为 AI 表演提供了更加真实生动的视觉体验。

image.png

【AiBase 热点:】

🎭 Vidu Q2 能够准确捕捉表情的微妙变化,增强了视频生成的自然度和情感表达。

🎥 支持多种视频模式,包括图像到视频、起始结束帧视频和可调节时长选项,满足多样化需求。

💡 盛舒科技致力于通过 AI 技术推动创意产业的发展,为用户提供更高品质的音视频创作体验。

2. 火山引擎推出 Lumi 平台,支持视觉模型 Lora 微调

火山引擎推出的 Lumi 平台现在支持 Doubao 和 Jiemeng 等视觉模型的 Lora 微调,旨在帮助企业高效定制独特的视觉风格,以满足市场需求。

image.png

【AiBase 热点:】

🧠 Lumi 平台支持视觉模型的 Lora 微调,帮助企业定制独特的视觉风格。

🚀 平台提供从图像生成到视频生成的端到端服务,满足企业场景中专业 AIGC 的需求。

💡 Lumi 平台帮助企业高效构建定制化的 AIGC 生产能力,提升用户体验。

3. 阿里云 CTO 透露:通义千文开源超过 300 个模型,下载量超过 6 亿次

在 2025 云栖大会上,阿里云展示了通义千文项目的显著成果,包括开源超过 300 个模型,下载量超过 6 亿次。这展示了阿里云在 AI 领域的强大影响力和技术实力,并通过开源模型推动技术创新和应用。

image.png

【AiBase 热点:】

🚀 通义千文项目开源超过300个模型,展现了强大的技术能力。

📊 总下载量超过 6 亿次,反映了用户对阿里云 AI 技术的认可度很高。

🖼️ 通义万象已生成超过3.9亿张图片和超过7000万段视频,展示了数字内容生成能力。

4. 百度开源 Qianfan-VL,昆仑芯片助力多模态 AI 突破

百度正式开源其最新的视觉理解模型 Qianfan-VL,包括 3B、8B 和 70B 三个版本,适用于不同场景。该模型具有强大的多模态能力,尤其在 OCR 和教育领域,其训练依赖于百度自研的昆仑 P800 芯片。

image.png

【AiBase 热点:】

🧠Qianfan-VL 是一款强大的多模态大型模型,能够同时处理图像和文本信息。

💡昆仑 P800 芯片支持模型的训练,低功耗、高效率,优化大规模计算性能。

🚀 Qianfan-VL 系列已在 GitHub 和 Hugging Face 上开源,供开发者免费使用。

详情:https://github.com/baidubce/Qianfan-VL

5. 微软整合 Anthropic AI 模型,扩展 Copilot 助手功能

微软宣布将 Anthropic 的 AI 模型整合到 Copilot 助手中,标志着其在生成式 AI 领域的多元化战略迈出了新的一步。尽管微软继续与 OpenAI 保持紧密合作,但它开始采用 Anthropic 的技术以满足商业客户的需求。企业用户现在可以使用 Anthropic 的模型构建 AI 代理,这些模型将在亚马逊和谷歌云上运行。

image.png

【AiBase 热点:】

🤖 微软将 Anthropic 的 AI 模型集成到 Copilot 助手中,推动产品多样化。

🔄 虽然微软与 OpenAI 保持着紧密关系,但它正逐渐采用 Anthropic 的技术。

🚀 企业用户可以选择 Anthropic 模型来构建 AI 代理,使用前需要管理员激活。

6. OpenAI 在美国建设了五个新的数据中心,加速了 Stargate 项目。

OpenAI 宣布在美国建设五个新的数据中心,以增强星门项目的计算能力。该项目由多家公司发起,总投资额为 500 亿美元,旨在推动生成式 AI 的发展。

image.png

【AiBase 热点:】

🌐 OpenAI 将在美国建设五个新的数据中心,Stargate 项目总计算能力将达到近 7GW。

💼 Oracle 将负责建设三个新的数据中心,Abilene 数据中心将扩建并增加 600MW 的计算能力。

🚀 OpenAI 计划未来每周增加 1GW 的 AI 基础设施,以推动人工智能技术的进一步发展。

7. NVIDIA 开源 Audio2Face 模型,人工智能助力生成实时面部动画

NVIDIA 开源了其生成式 AI 面部动画模型 Audio2Face,提供支持离线和实时处理的 SDK 和训练框架,适用于游戏、电影和其他领域。这项技术已被多个游戏开发者采用,提升了角色的真实感和沉浸式体验。

image.png

【AiBase 热点:】

🔊 NVIDIA 开源 Audio2Face 模型,提升虚拟角色面部动画生成技术。

🎮 支持离线渲染和实时流处理,适用于各种场景。

🌟 已被多家游戏开发者采用,简化制作流程并增强角色真实感。

详情:https://build.nvidia.com/nvidia/audio2face-3d

8. Meta 发布代码世界模型 CWM:一款具有沙盒模拟能力的 32B AI

Meta 的代码世界模型(CWM)是一个拥有 32B 参数的 AI 系统,它可以通过沙盒环境模拟和推理代码,减少错误并提高调试效率。该模型需要高硬件规格,需要双 H100 GPU 和 RDMA 技术支持。

image.png

【AiBase 热点:】

🧠 CWM 在生成代码之前在沙盒环境中模拟代码,预测代码执行的结果。

🔍 它可以快速识别代码错误,提高调试效率。

🚨 可在执行命令前预警潜在风险,增强安全性。

详情:https://github.com/facebookresearch/cwm