Oct 28, 2025 13:39:00

本文最初于 2025 年 10 月 28 日 13:39 以日语发布,可能包含一些机器翻译的部分。如果您想建议更正的翻译,请单击此处

新加坡人工智能开发公司 MiniMax 宣布将开源其最新人工智能模型 MiniMax M2

MiniMax M2 和 Agent:简约中的精妙 - MiniMax 新闻
**https://www.minimax.io/news/minimax-m2
**

MiniMax 表示:“之前没有单一的 AI 模型能够完全满足我们对智能体的需求。我们面临的挑战在于找到一个在性能、价格和推理速度之间取得恰当平衡的 AI 模型。这几乎是一个‘不可能三角’。海外优秀的 AI 模型性能优异,但价格昂贵且速度相对较慢。中国的模型价格低廉,但在性能和速度上存在差异。因此,现有的智能体产品往往价格过高或速度过慢,无法达到良好的效果。例如,许多智能体的订阅费用每月高达数十美元(数千日元),甚至数百美元(数万日元),并且完成单个任务可能需要数小时。”

因此,MiniMax 一直在探索开发一种在性能、价格和推理速度之间提供更好平衡的 AI 模型,而最终的成果就是 MiniMax M2。

下图比较了 MiniMax M2 与六款竞争 AI 的性能:DeepSeek-V3.2、GLM-4.6、Kimi K2 0905、Gemini 2.5 Pro、Claude Sonnet 4.5 和 GPT-5(思考)。MiniMax M2 在各项基准测试中始终表现出色。

在“工具使用”和“深度搜索”两个方面,MiniMax 评价道:“MiniMax M2 已经成功实现了与海外前沿 AI 模型非常接近的性能。虽然在编程能力上略逊于海外前沿模型,但在国内市场已经名列前茅。”

包括业务和后端团队在内的开发者正在与算法工程师合作,投入大量精力构建和评估环境,并越来越多地将人工智能融入到他们的日常工作中。MiniMax 解释说,在掌握了这些复杂场景之后,他们发现,通过将积累的技术应用于传统的知识、数学等大规模模型任务,他们自然就能取得更优异的成果。

例如,在

在**人工智能分析**基准测试中,MiniMax M2 综合了 10 项测试任务,取得了全球前五名的成绩。

MiniMax M2 的 API 价格为每百万输入令牌 0.3 美元(约 46 日元),每百万输出令牌 1.2 美元(约 183 日元)。这个价格约为 Claude 3.5 Sonnet 的 8%,但 MiniMax M2 的推理速度是其两倍。

下图比较了各款 AI 机型的性能与价格。纵轴代表性能(上方性能越高),横轴代表价格(右侧价格越低)。显然,MiniMax M2 是一款兼顾性能与价格的 AI 机型。

下图比较了各 AI 模型的推理速度(纵轴)和价格(横轴)。虽然推理速度是顶级的,但价格也是最低的。

** **

Simon Willison 解释了 MiniMax M2:“这是一个获得 MIT 授权的 AI 模型,自述基准测试表明,其性能与 Claude Sonnet 4 相当,但略逊于 Claude Sonnet 4.5。它在 Hugging Face 上的部署大小为 230GB,因此它可能无法在 128GB 的 NVIDIA Spark 上运行,但应该可以在 512GB 的 Mac Studio 上运行。”

张一帆表示:“1:Minimax 采用类似 GPT-OSS 的结构,即全注意力和滑动窗口注意力(SWA)交替使用。2:它使用 QK 范数,每个注意力头都有自己可学习的 RMS 范数。3:全注意力和 SWA 部分不共享设置,各自有自己的 RoPE theta 设置。” 对于不使用线性注意力的原因,他指出:“Flash 注意力(Dao et al.)非常有效,并且支持低精度训练和推理(FP8/FP4),但线性注意力在低精度下不起作用!”

有人指出,MiniMax M2 的型号类型是“混合型”。

此外,MiniMax M2 将提供对 vLLM 的 Day-0 支持,这将实现快速高效的推理和流畅的长文本上下文性能。