微调与即时工程:优化生成式人工智能模型的性能 -- 知识铺
GPT-4、PaLM 2、BARD……人工智能的进步一直在成倍增加。最重要的是,它们正变得可供所有人使用。
不仅仅是数据专家,还有商业领袖、营销经理,甚至是寻求帮助的学生。
然而,使用这些生成式人工智能解决方案并不是凭空发生的。这些解决方案的民主化表明了了解如何优化结果的重要性。
这就是快速工程和微调的用武之地。那么它们是什么?这两个概念有什么区别?这就是我们要找出的。
什么是微调?
尽管名字如此,人工智能模型其实并不“智能”。这种所谓的智能背后隐藏着在大型复杂数据集中找到关系的能力。但数据量如此之大,以至于大型语言模型 (LLMs) 依赖于优化技术。其中包括微调。
微调的定义
该技术是模型预训练所固有的,旨在加强已在更广泛的数据分布上进行训练的模型的专业化。因为存在能够执行通用任务的模型。
以及其他能够执行特定任务的人。正是在后一种情况下,微调发挥了作用。这个想法是专门响应用户的需求。例如,一家服装公司的客户支持聊天机器人不会以与负责生成医疗预诊断的聊天机器人相同的方式进行培训。
微调的目的是通过在特定数据上重新训练现有模型来优化现有模型的性能。通过调整模型的权重和参数,该技术使人工智能系统能够适应更具体的任务。
成功的微调
为了通过Fine-Tuning提高AI系统性能,需要特别关注两个参数:
- 数据质量:为了响应特定任务,提供的数据集也必须是特定的。
- 训练步骤:这不仅仅是训练模型以将数据置于情境中的问题,而是引导模型获得最佳结果。为此,需要建立一个通过人工评估的反馈系统。
什么是即时工程?
与 Fine-Tuning 一样,Prompt Engineering 也旨在提高机器学习模型的性能。但在这里,重点并不是训练模型,而是提示提供的结果。
提醒一下,提示对应于用户对生成人工智能应用程序(例如 ChatGPT)的请求。正是这些请求(提示输入)的质量决定了结果(输出)的质量。
具体而言,当您输入查询时,人工智能会分解提示以理解其含义和意图。
如果你问一个相当普遍的问题,人工智能系统将根据其掌握的数据为你提供答案。但由于它可能没有完全理解你的意图,它可能会给出错误的答案。
相反,如果您提供准确的提示来解释您的意图和上下文,人工智能将能够更好地响应您的请求。
因此,即时工程涉及通过制定特定查询来指导 ML 模型的响应。为了获得成功的提示,请毫不犹豫地提出更多、更具体的问题,并测试制定指令的不同方式。
快速工程与微调 - 有什么区别?
微调和即时工程是两种人工智能优化技术。但是,了解这两种方法之间的差异很重要:
-
目标:提示工程更注重产生相关结果,而微调旨在提高机器学习模型的性能以完成某些任务。
-
方法:即时工程基于输入指示。这些都需要更加详细才能达到更好的效果。另一方面,微调基于训练模型和集成新的特定数据。
-
控制:通过 Prompt Engineering,用户可以完全控制结果。另一方面,微调的目的是赋予计算机更大的自主权以产生所需的结果。
-
资源:快速工程不一定需要资源。尤其是许多生成式人工智能应用程序都是免费的。因此任何人都可以微调他们的提示以优化结果。
另一方面,微调需要大量资源,用于训练模型和添加大量数据。
您如何掌握微调和快速工程?
尽管微调和提示工程截然不同,但它们有一个共同的目标:提高生成式人工智能模型生成的答案的准确性和相关性。对于数据专家来说,掌握这些技术是非常有必要的。这就是 DataScientest 发挥作用的地方。
通过我们的培训计划,您将发现改进语言模型结果的最佳技术。加入我们吧!
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/gpt/post/202403/prompt/%E5%BE%AE%E8%B0%83%E4%B8%8E%E5%8D%B3%E6%97%B6%E5%B7%A5%E7%A8%8B%E4%BC%98%E5%8C%96%E7%94%9F%E6%88%90%E5%BC%8F%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%80%A7%E8%83%BD--%E7%9F%A5%E8%AF%86%E9%93%BA/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com