LLMs 已成为家喻户晓的名字,这要归功于他们在将生成式人工智能带到公众利益的前沿方面所发挥的作用,以及组织致力于在众多业务职能和领域采用人工智能的重点。用例。

在企业环境之外,随着生成式人工智能的新发展,LLMs 似乎是突然出现的。然而,包括 IBM 在内的许多公司花费了数年时间在不同级别实施 LLMs,以增强其自然语言理解 (NLU) 和自然语言处理 (NLP) 能力。这与机器学习、机器学习模型、算法、神经网络和为这些人工智能系统提供架构的变压器模型的进步一起发生。

LLMs 是一类基础模型,它们经过大量数据的训练,以提供驱动多个用例和应用程序以及解决大量任务所需的基础功能。

这与为每个用例单独构建和训练特定领域模型的想法形成鲜明对比,这种想法在许多标准(最重要的是成本和基础设施)下是令人望而却步的,会抑制协同作用,甚至可能导致性能较差。

LLMs代表了自然语言处理和人工智能领域的重大突破,公众可以通过Open AI的Chat GPT-3和GPT-4等界面轻松访问,这些界面已经获得了微软的支持。

其他示例包括 Meta 的 Llama 模型以及来自 Transformer (BERT/RoBERTa) 和 PaLM 模型的 Google 双向编码器表示。 IBM 最近还在 watsonx.ai 上推出了 Granite 模型系列,该模型已成为 watsonx Assistant 和 watsonx Orchestrate 等其他 IBM 产品的生成 AI 骨干。

简而言之,LLMs 旨在根据用于训练的大量数据,像人类一样理解和生成文本以及其他形式的内容。

他们有能力从上下文中推断,生成连贯且与上下文相关的响应,翻译成英语以外的语言,总结文本,回答问题(一般对话和常见问题解答),甚至协助创意写作或代码生成任务。

他们之所以能够做到这一点,要归功于数十亿个参数,这些参数使他们能够捕获语言中的复杂模式并执行各种与语言相关的任务。

LLMs 正在彻底改变各个领域的应用程序,从聊天机器人和虚拟助手到内容生成、研究协助和语言翻译。

随着它们不断发展和改进,LLMs 有望重塑我们与技术交互和获取信息的方式,使它们成为现代数字景观的关键部分。