阿里巴巴研究团队最近发布了 Wan 2.2,这是其著名 Wan 系列的继任者。截至 2025 年 7 月,它是可用的最佳视频生成模型之一,与海浪最小-最大 2.0、Seedance 1.0 Pro 和 Kling 2.1 Master 等巨头一同进入了一个竞争激烈的领域。虽然它在顶级 Veo 3 之下,但该模型在价格昂贵和缺乏开放式的图像到视频生成方面也存在问题。

像 Fal 和 WaveSpeedAI 这样的知名公司已经开始托管 Wan 2.2,每秒视频的价格约为 0.08 美元。这意味着 5 秒视频的费用是 0.40 美元,或每分钟 4.80 美元。以下是它与闭源竞争对手的对比:

Veo 3: $45/min

Kling 2.1 Master: 16.80 元/分钟

Seedance 1.0 Pro: 7.44 元/分钟

Wan 2.2: 4.80 元/分钟

Hailuo Minimax 2.0: 2.70 元/分钟

我的测试表明,Wan 2.2 是一个很好的模型,但并非最佳。而在性价比方面,Minimax 2.0 以更低的成本提供了更好的质量,将其远远甩在后面。这引发了一个关键问题:如果一个新模型既不是最好的也不是最便宜的,为什么还要托管它?

答案在于一个巨大的优势:Wan 2.2 是开源的。这个单一因素可以将其推到聚光灯下,并为托管它的公司创造有趣的市场机会。

发布一个高质量的开放源代码视频模型可以培养一个生态系统,推动渐进式改进。我们之前已经看到过这种情况——从 Stable Video Diffusion 到 Hunyuan,再到 Wan 系列,每个开放模型都为社区解锁了新的研究和能力。还有大量的人对在本地托管这些模型感兴趣(向 r/StableDiffusion 致敬)。

例如,Wan 2.1 的发布引发了 LoRAs、适配器和像 VACE 这样的修改的爆炸式增长,这些修改升级了社区使用模型的方式。甚至还开发了在低内存或资源受限环境中运行它的技术,以及训练 LoRAs 的方法,使用户能够添加自己的独特风格。

这让我们来到了托管这些模型的经济问题。有了 Apache 2.0 许可证,任何人都可以商业化地提供 Wan 2.2。但看看价格,这是怎么运作的?这是否只是一场向最低点冲刺的竞争?

让我们看看 Fal,它将 5 秒剪辑的价格定为 0.40 美元。在 8 个 H100 GPU 上,一个 30 步的生成(Fal 的默认设置)大约需要 3 分钟。长期租赁下,一个 H100 GPU 的运行费用大约是 1.00 美元/小时。根据这些数据,Fal 单次 5 秒生成的成本大约是 0.40 美元。在最理想的情况下,他们只能收支平衡。如果用户增加步数,由于他们的定价保持不变,Fal 就会亏损。

当然,提供商有内部优化——定制的内核、专门的调度器,或者像 TeaCache 这样的技巧,可以加快推理速度。假设保守的 25%速度提升,成本降至每 5 秒剪辑 0.30 美元。这意味着在默认生成中,他们能赚一毛。挺不错的,对吧?

其实不是。每 1000 次推理赚取 100 美元并不是通往财富的道路。视频生成是一个小众领域,尽管在启动时流量很高,但随着下一个模型夺走聚光灯,流量会逐渐减少。即使 Fal 每天生成 10,000 个视频连续三个月,他们的利润也只有大约 90 万美元——这几乎不足以证明他们 4900 万美元 B 轮融资的合理性。

那么提供 LoRA 微调服务呢?这是开源的另一个好处。Fal 提供 Hunyuan LoRA 训练服务,收费 5 美元。我们可以估计他们的基础设施成本大约是每个 LoRA 3.50 美元。即使每天有 1000 个 LoRA,三个月的利润也大致相当。这不是主要业务。

那么,这些公司实际上是如何赚钱的呢?事实是,大部分收入并不是来自为消费者托管这些模型。真正的金矿在于企业交易和专用实例。

传闻 Together AI 的营收即将突破 5 亿美元,其中大部分收入来自为企业客户提供专用实例或裸金属服务器。这些公司需要安全的私有基础设施以满足合规性和责任要求,并且愿意为此支付溢价。Fal 和 Replicate 也提供类似的带有服务级别协议和客户支持的企业套餐。不难想象,他们真正的收入可能就来自这里。

这次重新定义了整个活动。为消费者托管最新的开源模型并非为了直接盈利。这是一种漏斗顶部的策略。它作为一种技术实力和可靠性的公共展示,建立起了声誉,这为高利润的企业合同打开了大门。鉴于这种有利可图的机遇,你为何要费尽心思成为这些开源模型的领先提供商,即使面向消费者的利润不存在,这也是完全合理的。

所以下次当你考虑如何在这些公司的游戏中超越它们时,记住真正的竞技场可能完全在另一个地方。