作为一个追逐每一个新 AI 发展并喜欢撰写相关文章分享的人,Gemini 3 号称能处理 140 多种语言,这话当真吗?我可不想等到 2025 年就过去,却不亲自测试一下。不会说你语言的 AI 就像一扇锁着的门——所以我想看看 Gemini 3 是否真的能把钥匙交给你。以下是我的真实体验,简单易懂,没有专业术语。


多语言人工智能不再只是“锦上添花”的玩意儿。像你我这样的全球用户需要能够使用_我们_语言的工具,而不仅仅是英语。我之所以从这里开始,是因为“它的重要性”为“它的效果如何”奠定了基础。如果一个工具只能用英语交流,那么世界上一半的人就无法充分使用它——而这正是 Gemini 3 声称可以解决的问题。

140多种语言

140 种语言可不是随便说说的。它涵盖了主流语言——西班牙语、普通话、阿拉伯语——你知道的,就是那些热门语言。而且它还不止于此。它还包括一些不太常见的语言:斯瓦希里语、乌尔都语、芬兰语……我特意测试了那些不太常见的语言。我用冰岛语问了问传统工艺,它没有空白。它正确地说出了“húshækkja”(房屋堆叠)。这让我很惊讶。我还用乌尔都语问了问茶的传统,它说出了“kahwa”,并解释说它通常与小豆蔻一起食用——我只从巴基斯坦的朋友那里听说过这种说法。为了证明这一点,谷歌自己的文档支持这个范围。你可以查看 Google Lang Docs 来查看完整列表。这个官方链接让这个说法看起来不像是炒作。

非英语语境

真正的考验不仅仅是翻译单词,而是要正确理解语境。我尝试用韩语问了一个简单的问题:“首尔冬天吃什么好?” 它并没有直接说出“泡菜锅”——顺便说一下,那是泡菜汤。它更进一步,补充道:“通常会搭配年糕一起吃,以保暖。” 这是一个当地特色的细节,正是非英语用户所需要的。我又尝试用西班牙语问了另一个问题:“墨西哥城周末常吃的小吃是什么?” 它并没有直接说出“牧师炸玉米饼”——而是指出,这种小吃通常在下午 6 点后在街边小摊上吃。这种细节是普通翻译软件无法提供的。我们不需要逐字翻译——那不是我们想要的。我们想要贴近我们日常生活的答案。Gemini 3 在这方面比我尝试过的一些老工具做得更好。


测试设置

为了确保公平,我制定了明确的规则。没有随机检查——只有结构化的步骤来检验结果是否一致。我不想让我的意见影响结果;我想要真实的、可重复的结果。

5个语言对

我挑选了 5 对来涵盖不同的语系和用户。它们如下:

  1. 英语 ↔ 普通话(适用于东亚用户和全球业务)
  2. 西班牙语 ↔ 阿拉伯语(涵盖拉丁美洲和中东)
  3. 法语 ↔ 日语(两种常用语言,但语法比较棘手)
  4. 俄语 ↔ 印地语(东欧和南亚)
  5. 葡萄牙语 ↔ 斯瓦希里语(连接巴西和东非)我还为每对配对添加了一个快速检查。我询问了当地的公共交通情况。我想看看它是否正确地使用了“metro”(西班牙语)或“subway”(英语)等术语来描述每个地区。它基本上都正确。对于俄语-印地语配对,我询问了“如何问候长辈”。它都答对了——俄语是“zdravstvuyte”,印地语是“namaste”,并略微鞠躬。没有失误。

准确度指标

我并没有直接说“它有效”。我使用了三个简单的标准:

  • _意思_表达对了吗?别把“我需要帮助”和“我不需要帮助”搞混了。
  • 语法正确吗?日语和俄语都没有断句。
  • 它符合当地文化吗?我用印地语点了适合印度教的菜,结果没有牛肉菜。为了验证,我又用 VentureBeat Test 做了测试。他们的数据跟我的很像。这让测试结果看起来更靠谱,而不仅仅是我个人的看法。

结果与用途

数字很重要,但如何使用这个工具也同样重要。如果统计数据不能转化为实际应用,那就毫无用处——而 Gemini 3 的统计数据却能。以下是一些让我印象深刻的地方。

准确率高达 95%

在这 5 对测试中,Gemini 3 的平均准确率达到了 95%。让我们来分析一下:

  • 主流语言对(英语↔普通话、西班牙语↔阿拉伯语)占比接近 98%。
  • 棘手的语法对(法语↔日语)占93%。
  • 即使是不太常用的(葡萄牙语↔斯瓦希里语)也达到了 90%。这很高——足以应付日常使用。例如,我用斯瓦希里语询问“雨季活动”。它建议“mvua wa kiafya”(有益健康的雨水),比如农业。这正是当地人会说的话。对于法语-日语,我问“如何点不加糖的咖啡”——它完美地翻译成了“un café sans sucre”和“sugar naku kōhī o onegaishimasu”。没有语法错误,即使是否定句。

全球应用程序

我思考了不同的用户可能会如何使用它。以下是四个真实的例子:

  • 墨西哥的小企业主可以与阿拉伯供应商聊天。
  • 肯尼亚的护士可以阅读葡萄牙医疗指南(针对巴西的设备)。
  • 加拿大的学生可以用他们的第一语言印地语问数学问题。
  • 印度尼西亚的一位老师可以用它从英语网站提取教案,并用印尼语向学生讲解。这些并非“将来”才会用到的。你现在就可以用 Gemini 3 来实现。

提示和限制

没有完美的工具。我找到了让 Gemini 3 更好用的方法,也发现了它的不足之处。坦诚地分享这些见解,是分享实用 AI 洞见的一部分。

快速调优

为了提高准确率,可以调整提问方式。例如:

  • 不要只说“翻译成乌尔都语”,而要说“翻译成乌尔都语——谈论农民的日常工作”。
  • 对于阿拉伯语,添加一个地区:“用阿拉伯语为埃及用户解答,而不是沙特阿拉伯用户。” X 多语言社区分享了这个技巧。它对我很有用。我曾经忘记指定埃及阿拉伯语。它使用了沙特术语,感觉不对劲。添加这个小细节解决了这个问题。有一次,我问“用泰米尔语告诉我节日”,但没有具体说明。它给出了大概的信息——但当我添加“泰米尔纳德邦”时,它提到了丰收节的甘蔗传统。这个小小的调整带来了巨大的改变。

区域模型

它的局限性是什么?它很难处理地方方言。例如:

  • 在中国,它可以很好地处理标准普通话,但不能处理四川方言。
  • 在意大利,标准意大利语还可以,但西西里方言却不尽如人意。
  • 在西非,标准豪萨语可用,但尼日利亚北部的卡诺方言不可用。
  • 即使是葡萄牙语,它也能准确区分巴西和欧洲的方言——但如果你要求输入巴西东北部的 Nordestino 方言,它就会出错,而是给出标准的巴西葡萄牙语。这些差异不会影响该工具的运行。大多数用户不需要使用过于方言化的方言。但如果你与依赖当地语言的社区合作,了解这些差异还是很有用的。

值得回顾的往期剧集:

文章浏览量: 3