迈向人工智能学习“员工知识”的时代:利用内部知识的生成式人工智能运营技术 --知识铺
人工智能“向人学习”时代的曙光
随着GPT-5的问世,AI已经从单纯的应答设备演变为“知识共享和成长的存在”。
AI吸收员工的专业知识和判断力,并将其作为知识重新用于整个组织——这就是目前备受关注的“知识驱动型AI运营”。 通过人工智能理解和利用信息,企业将能够拥有“不依赖于人的知识机制”。
内部知识利用现状:碎片化的信息资产
企业知识分散在会议记录、聊天、手册、电子邮件等中。 然而,其中许多没有被搜索、更新,或者成为埋藏的信息资产而没有被利用。 在生成式人工智能采用的早期阶段,有很多情况是基于外部信息给出答案的。 当今企业面临的下一个挑战是让人工智能学习自己的数据并利用业务知识。
生成式人工智能×知识利用的基本结构——“RAG”掌握关键
使生成式 AI 能够利用内部知识需要结构化机制。 其核心是一种名为“RAG(检索增强生成)”的技术。 RAG是指生成式AI自行从外部(或内部)知识库中搜索信息,并据此生成答案的机制。
RAG的基本结构由以下三层组成:
- 数据层(知识库)
整合所有知识资产,包括内部文档、会议纪要、常见问题解答和产品规格。 这个阶段的关键是“塑造信息”和“设计访问权限”。 标准化不同的格式,例如 PDF、Word 和 Slack 日志,以使员工可以安全使用。 - 知识搜索层(Vector DB)
这一层不仅仅是一个关键字搜索,而是一个查找接近上下文的信息的层。
一些最常见的机制包括松果、Weaviate、Chroma 和 FAISS。 通过使用这些,您将能够立即回忆起“具有相似含义的文件”和“相关会议记录”。 - 生成层 (LLM)
GPT-5 和 Claude 4.1 等现代法学硕士根据搜索结果生成自然日语答案。 例如,如果您询问“本程序手册的修订版在哪里?”,它将查找相关文档,对其进行总结,并建议下一步行动。
这种配置使人工智能不仅能够“知道”,而且能够“在上下文中回答”。 RAG可以说是**“AI理解内部知识的翻译设备”**。
AI学习员工知识的三种方法- 将“人类智慧”转化为数据
(1)FAQ型学习——让AI学习重复的问题
通过让人工智能学习内部查询和支持台的历史记录,可以自动回答预设问题。 我们整理公司内部每天发生的“常见问题”,例如人力资源、会计和 IT 支持,并构建一个由人工智能承担主要响应的系统。
重要的不是简单地准备一个答案,而是能够一起呈现答案的支撑(来源)。 这为人工智能的陈述创造了可信度,并减轻了联系人的负担。
(2)文档联动类型(使用RAG)——唤醒文档的“休眠值”
矢量化公司内海量文档,AI根据上下文理解搜索并汇总必要的信息。 这使得重复使用其他部门的材料和过去的会议记录成为可能,从而大大改善了部门之间的知识共享。
特别是,GPT-5改进了长篇处理能力,可以一次总结和比较数万个字符的文档。 无论是“从过去的报告中提取类似案例”,还是“仅总结程序手册的修改点”,人工智能都充当了知识复用引擎。
(3)对话式知识共享——聊天成为“内部知识的档案”
这是一种将生成式人工智能链接到 Slack 和 Microsoft Teams 等内部聊天以分析和学习对话内容的方法。 人工智能会记住过去的讨论和决定,并引用并为下一次会议提出相关陈述。
通过添加“此事是在上次会议上决定的”,人工智能将大大减少信息的重复和重新确认。 这种对话方法代表了人工智能可以在与人类相同的环境中思考的“下一阶段”。
引入步骤和注意事项 - 创建“允许 AI 学习的设计”
第 1 步:数据准备 - 将信息转换为“可学习的形式”
为了让人工智能正确学习,组织数据至关重要。 知识卫生是第一步,例如删除重复文档、统一文件命名约定和归档旧信息。 同时,它实施了访问控制,并明确了人工智能可以处理什么和不能处理什么。 开发信息是一个简单的过程,但如果忽视这一点,“记住错误知识的人工智能”就会诞生。
第 2 步:构建 RAG 环境 - Master LangChain、LlamaIndex 和 Flowise
为了将内部知识与人工智能联系起来,构建 RAG 环境非常重要。 代表性的技术基础被称为 LangChain 和 LlamaIndex。 使用这些工具,您可以自动拆分和汇总 PDF、Markdown 和 CSV 等各种格式的文档,并将其注册为 AI 的搜索目标。
此外,像 Flowise AI 这样的无代码构建工具允许非工程师连接 RAG 并管理矢量数据库。 通过很好地结合这些工具,可以在现场作“了解贵公司知识的人工智能”。
第三步:持续学习和评估 – 创建“人工智能成绩单”
人工智能不会以介绍结束。 有必要定期检查回复的准确性和有效性,并运行反映员工反馈的“改进周期”。 特别是在 RAG 配置中,如果在源数据更新时不重新训练或重新编制索引,则 AI 答案将保持过时状态。 通过定期识别“人工智能回答错误的情况”并纠正数据,将完成一个人工智能不断发展的系统。
此外,通过明确说明人工智能回复的范围和职责,并说明“此答案是人工智能提案,最终决定由人类做出”的规则,将提高公司的可信度。
安全和隐私视角
人工智能学习的数据可能包括个人信息、业务合作伙伴名称、合同细节等。 因此,要彻底贯彻以下三点。
- 屏蔽/匿名化敏感信息
- 记录访问日志和使用历史记录
- 由本地法学硕士进行内部完整运营
第三点尤为重要,因为使用运行在内部服务器上的本地 LLM 而不是外部 API 类型的 ChatGPT 可以同时实现保密性和运营效率。
总结:AI“连接知识”时代已经到来
在GPT-5时代,AI不仅处理信息,还学习员工的知识,传播组织的知识。 引入知识AI不仅仅是拥有一个方便的搜索工具,而是培育一个“组织存储设备”。
AI学习员工的知识,员工培育AI。 拥有这种双向学习周期的公司将在下一个智力生产力时代引领潮流。
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/ai001/post/20251009/%E8%BF%88%E5%90%91%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E5%AD%A6%E4%B9%A0%E5%91%98%E5%B7%A5%E7%9F%A5%E8%AF%86%E7%9A%84%E6%97%B6%E4%BB%A3%E5%88%A9%E7%94%A8%E5%86%85%E9%83%A8%E7%9F%A5%E8%AF%86%E7%9A%84%E7%94%9F%E6%88%90%E5%BC%8F%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD%E8%BF%90%E8%90%A5%E6%8A%80%E6%9C%AF/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com