亲爱的订阅者,

今天,我想分享一份按用例划分的最佳 AI 模型的更新指南。

我制作了一个视频,对 Claude 4、ChatGPT O3 和 Gemini 2.5 进行了编码、写作、深度研究、多模态等方面的对比测试。我发现,“最佳”模型取决于你的目标。 点击此处观看我现场测试这三款模型:

立即在 YouTube 上观看 。

时间戳:

  1. 00:00 )ChatGPT、Claude 和 Gemini 的 6 个实际用例对比

  2. 00:29 )编程:一次性构建俄罗斯方块

  3. 04:01 )编码:这个模型构建了超级马里奥 1 级

  4. 08:18 )写作:这个模型最能体现我的写作风格

  5. 11:15 )每日一答:ChatGPT 的记忆功能很神奇

  6. 13:11 )深入研究:427 个来源 vs. 高质量洞察

  7. 18:07 )图片、语音和视频:ChatGPT 与 Gemini 正面交锋

  8. 19:14 )您今天可以尝试的实时摄像头和电脑使用功能

[

](https://substackcdn.com/image/fetch/$s_!vVjH!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F4a1d873b-5aed-43ec-ba40-ef0668574833_3480x3165.png)

这篇文章由 Jira Product Discovery 为您带来

[

](https://www.atlassian.com/software/jira/product-discovery?utm_source=influencer-peter-yang&utm_=newlsetter&utm_campaign=&utm_sfdc-campaign_id=701QB00000CvkbxYAB)

产品经理花费太多时间在静态幻灯片中更新路线图或在电子表格中收集反馈。Jira Product Discovery 可以改变这一现状,让您轻松:

  1. 在专用中心捕捉见解、 产品创意和功能请求。

  2. 使用基于证据的框架对想法进行优先排序

  3. 将路线图与利益相关者的意见进行协调,以供评论和投票。

免费试用 Jira Product Discovery

在编码方面,我要求每个模型“创建一个功能齐全、图形精美、控件齐全的俄罗斯方块”。结果如下( 视频演示 ):

  1. 克劳德制作了一款华丽的游戏,其中有分数、下一首曲目预览和出色的控制。

  2. ChatGPT O3 创建了一个可以运行但缺少功能的基本克隆。

  3. Gemini 2.5 是一款不错的游戏,但视觉效果不如 Claude 精致。

[

](https://substackcdn.com/image/fetch/$s_!gemN!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F54ea8b73-1ba0-43d8-a2a4-267cdf8c633a_2640x1480.png)

为了进一步考验 Claude,我让它“创建一个 2D 马里奥游戏”。经过 10-15 分钟的反复尝试,它终于构建出了一个真正可玩的关卡 1, 里面有蘑菇、蘑菇怪等等。Gemini 和 O3 都远不及它。

但问题在于——Claude 4 Sonnet 的价格是 Gemini 2.5 Flash 的 20 倍。所以,如果你的 AI 产品在意成本,不妨考虑 Gemini。

[

](https://substackcdn.com/image/fetch/$s_!ZdCH!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fd3583948-aa3e-4252-9a94-2d87a32bd7d1_1456x415.png)

谷歌最近疯狂地发布了以下产品:

  1. Gemini 2.5 Pro 和 Flash 是价格实惠的可靠型号。

  2. Jules 是一个类似于 OpenAI Codex 的异步编码代理。

  3. Gemini Diffusion 是一种新模型,可让您快速感受代码的即时性:

编程的底线:选择 Claude 4 可获得最佳效果。选择 Gemini 2.5 可获得最佳性价比。

写作:克劳德掌握你的写作风格

[

](https://substackcdn.com/image/fetch/$s_!vW_O!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fb1b8646e-e484-49c7-9260-67ce53a4b4b0_2652x1482.png)

我主要使用人工智能来编辑我的写作,例如新闻稿、战略文档和短文段落。我的流程很简单( 视频演示 )。首先,我会将我最好的写作样本提供给人工智能。然后我会让它根据这些样本编辑我的草稿。

我测试了所有三种模型,使用我的时事通讯编辑提示(可在我的付费订阅者提示库中找到 ) 来编辑这篇文章 :

  1. 克劳德掌握了我的谈话风格和形式。

  2. ChatGPT 删减了太多副本并丢失了重要细节。

  3. Gemini 2.5 的编辑感觉太过冗长和枯燥。

因此,Claude 仍然是我日常的主力,因为它比任何其他模型都更能捕捉我的写作风格——尤其是当我向它提供我最好的作品示例时。

每日解答:ChatGPT 让您

[

](https://substackcdn.com/image/fetch/$s_!HUGf!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F34ee362f-38d6-46e9-b982-ec2158b2e5c9_2428x830.png)

这三种模型都可以回答日常问题,但 ChatGPT 有一个杀手级功能: 记忆

这创造了神奇的时刻。例如,它记得我很快就要计划旅行了,所以它建议我询问法国最值得游览的地方。

ChatGPT 也非常适合自省。试试这个提示( 视频演示 ):

Tell me something unique you notice about me, but I haven't realized about myself yet. Doesn't have to be positive — just be truthful.

坦率地说,我很惊讶克劳德和双子座在 2025 年仍然没有记忆。ChatGPT 是一个让你着迷的模型——用它来发现你隐藏的才能和盲点

深入研究:ChatGPT 找到了最佳平衡点

[

](https://substackcdn.com/image/fetch/$s_!ko7a!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F38027e94-8305-4b4b-890e-b6bdc3df1c8b_2642x1484.png)

现在每个提供商都提供“深度研究”功能,因此我对每个功能进行了测试:“研究人工智能编码市场并分享 Bolt 的竞争策略。”

结果非常明显( 视频演示 ):

  1. 克劳德写了一份 7 页的报告,涵盖了 427 个来源。这份报告很好地整合了洞见,而不是简单地堆砌信息。但其中的建议却显得很普通。

  2. ChatGPT 发布了一份长达 36 页的报告,其中包含 25 个来源。报告包含与 Bolt 实际做法相符的具体建议——针对非技术用户、注重速度以及添加集成功能。

  3. Gemini 出具了一份长达 48 页的报告,其中包含 100 个来源。报告内容很全面,但结论过于冗长,听起来像是公司内部的胡言乱语。

我坦白说——我很少完整地阅读“深度研究”报告。相反,我会略读它们,然后将它们加载到 AI 项目中 ,为 AI 提供合适的背景,从而完善我的战略文档和其他成果。

对于这个用例,我认为 ChatGPT 恰到好处。它既不太短(Claude),也不太长(Gemini)。

图像生成:ChatGPT 仍然占据主导地位

[

](https://substackcdn.com/image/fetch/$s_!fiKF!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F921ff2b5-7835-41d3-b70e-d51db6a773f1_2636x1480.png)

ChatGPT 的图像功能仍然经常让我惊叹不已( 视频 )。

它最能遵循指令,并能产生最佳的文本渲染效果。我用它创建营销素材、信息图表,甚至和女儿一起创作漫画。

关键在于给它提供你想要的样式示例,然后要求它进行具体的调整。这里有一个 5 分钟的短视频,涵盖了我最喜欢的 5 个用例

语音聊天:ChatGPT 有个性(还会唱歌)

ChatGPT 拥有最自然的语音流畅度和个性。它现在甚至可以唱歌了——虽然唱得很糟糕,但说实话,这挺搞笑的(可以听听上面的内容)。

话虽如此,ChatGPT 和 Gemini 的语音功能让我很不爽的是,它们总是喜欢打断你说话。你可以告诉它“在我告诉你说完之前别打断我”,但我还是更喜欢用 Superwhisper 之类的语音应用来听写。

视频:Gemini 的 Veo 3 令人惊叹

对于视频而言,Gemini 远远领先于竞争对手。

谷歌最新的 Veo 3 型号可以将简单的文字提示转换成带有声音和语音的 8 秒视频。光是试用一下就值一个月的 Gemini Pro 了。比如,我用它制作了一只柯基犬在钢琴前唱歌的画面 。

总体而言,AI 视频在质量和数量上都将迎来爆发式增长。我很快会写更多关于这个领域的文章。

实时摄像头和电脑使用:尚未准备好

[

](https://substackcdn.com/image/fetch/$s_!EnA_!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2F49976cdc-d1e0-46f0-ba5e-cc1f8f22f597_2644x1482.png)

最后,我们来谈谈实时摄像机和计算机的使用( 视频 )。

  1. 实时摄像头可以让 AI 查看你的电脑屏幕。我喜欢在 Vibe 编程时打开 Gemini 的实时摄像头,这样我就可以实时调试问题。

  2. 计算机的使用可以让人工智能控制你的键盘和鼠标。我更喜欢 OpenAI 的 Operator,因为它使用了最佳推理模型 O3。你可以用它来查找旅行信息或预订餐厅。

这两个功能都还处于早期阶段,但如果您对人工智能代理感到好奇,那么值得尝试。

那么您应该使用哪种模型?

[

](https://substackcdn.com/image/fetch/$s_!iQOU!,f_auto,q_auto:good,fl_progressive:steep/https%3A%2F%2Fsubstack-post-media.s3.amazonaws.com%2Fpublic%2Fimages%2Fe9ddcee6-1f82-4728-8602-e4883ee8195e_3480x3165.png)

有趣的是,上述特征揭示了每家公司的战略:

  1. OpenAI 想要成为你的私人 AI 助理。 他们正在主导消费市场,并在 AI 编码方面有所动作,包括 Codex 代理 ,甚至还有传闻称即将收购 Windsurf。

  2. Claude 希望拥有企业级的编码能力。 他们的首届人工智能大会完全致力于编码和开发者。Claude 仍然是 Cursor 的默认模型 ,Anthropic 也在改进 Claude Code

  3. 双子座终于苏醒了。 谷歌在 I/O 大会上发布的 AI 功能数量之多令人难以置信。双子座拥有迄今为止最具成本效益的模型,并且凭借 Veo 3 实现了一流的多模态功能。

因此,以下是何时使用的:

  1. 如需日常个人帮助,请使用 ChatGPT

  2. 对于写作和专业编码来说, Claude 是值得购买的。

  3. 对于预算有限的视频和 AI 产品构建,请尝试 Gemini

三位出色的模特将与我们展开激烈角逐,我们对此感到非常惊喜。如果您还没看过, 可以观看我的视频 , 了解完整的演示和攻略。

请在评论中告诉我您最喜欢的 AI 模型是什么以及原因。