Milvus 老友汇:AI、云原生与向量数据库的碰撞回顾 -- 知识铺
一场久违的老友对谈,一次精妙的AI探索碰撞。
近日,Milvus老友汇·Arch Meetup在上海圆满落幕。本次Meetup亮点颇多,不仅得到了KubeBlocks社区的大力支持,而且邀请了来自网易伏羲和蚂蚁集团的资深专家,他们现场分享了各自对于AI时代云原生与向量数据库的深入思考。
活动概述
- 活动名称:Milvus老友汇·Arch Meetup
- 时间:近日
- 地点:上海
- 支持单位:KubeBlocks社区
特邀嘉宾
- 网易伏羲的资深专家
- 蚂蚁集团的资深专家
分享主题
- AI时代下的云原生技术
- 向量数据库的发展趋势与应用
活动亮点
- 深入探讨了AI技术在云原生环境中的融合与应用。
- 专家们分享了他们在AI领域多年的经验和见解。
结语Milvus老友汇·Arch Meetup为参与者提供了一个交流思想、分享经验的平台,促进了AI技术在云原生与向量数据库领域的进一步发展。
Milvus 2.3.x 版本新功能与实践分享
以下是对本次活动的主要内容进行的梳理和解读,以帮助大家更好地理解和吸收。
一、Milvus 2.3.x 版本介绍
1. 架构优势
- Zilliz 资深工程师 夏琮祺 强调了 Milvus 2.3.x 在架构上的先进性,它在向量数据库领域具有显著的领先优势。
2. 新功能亮点
- 夏琮祺还介绍了 Milvus 2.3.x 的新功能,这些功能将为用户带来更加丰富的使用体验。
3. 性能提升
- 性能是 Milvus 2.3.x 的一大卖点,夏琮祺从多个角度分析了其性能的提升。
4. 可维护性
- 夏琮祺指出,Milvus 2.3.x 在可维护性方面也做了很多优化,使得维护工作更加轻松。
二、Milvus 在网易伏羲的应用实践
1. 应用场景
- 网易伏羲资深 AI 研发工程师 陈京来 分享了 Milvus 在网易图文多模态场景中的应用,展示了其在处理十亿级图文数据方面的强大能力。
2. 应用落地
- 陈京来进一步阐述了 Milvus 如何支撑网易伏羲的应用落地,说明了其在实际业务中的重要性。
三、KubeBlocks 在向量数据库管理中的应用
1. KubeBlocks 工具介绍
- 云猿生数据资深工程师 郭子昂 介绍了 KubeBlocks 工具,它能够简化向量数据库以及 AIGC 数据基础设施的管理。
2. 管理优势
- 郭子昂强调了使用 KubeBlocks 管理向量数据库的便捷性,提升了管理效率。
四、KCL 在工程化配置策略中的应用
1. KCL 语言介绍
- 蚂蚁集团工程师 徐鹏飞 介绍了 KCL 声明式配置语言,它在工程化配置策略中发挥着重要作用。
2. 应对挑战
- 徐鹏飞分享了如何使用 KCL 应对工程化配置策略的挑战,提高了配置的灵活性和可维护性。
结语
本次活动涵盖了 Milvus 2.3.x 的新功能、应用实践以及相关工具的使用,为向量数据库和 AI 领域的专业人士提供了宝贵的信息和经验分享。
Milvus 2.3.x 版本在架构上进行了显著升级,以增强其对异构硬件的支持,包括 GPU Index 采用 RAFT 技术,以及对 ARM 架构的适配。夏琮祺特别强调了 QueryNodeV2 的重要性,它作为 Milvus 系统中提供检索服务的核心组件,其稳定性、性能和扩展性对整个系统至关重要。QueryNodeV1 曾面临状态复杂、消息队列重复、代码结构不清晰和报错内容不直观等问题。QueryNodeV2 通过重新设计,实现了代码结构的优化,状态管理的简化,以及资源浪费的减少,使得其在稳定性测试中表现更加出色。
在新功能方面,Milvus 2.3.x 引入了一些值得关注的特性:
-
Upsert 操作:由于 Milvus 之前不支持 update 操作,用户需要通过删除旧记录并重新插入来更新向量。2.3 版本中,Upsert 接口的引入,提供了一种原子性的“修改”操作,简化了用户的操作流程。
-
SCANN Index 支持:Milvus 2.3.x 通过 Knowhere 2.0 支持了 SCANN 索引,这为系统提供了更高效的搜索能力。 QueryNodeV2 的升级和新功能的加入,不仅提升了 Milvus 的性能和用户体验,同时也为未来的技术发展奠定了基础。
Milvus 2.3.0 更新详解
1. Iterator 接口(仅限 pymilvus)
Milvus 2.3.0 版本在 pymilvus 中引入了 Iterator 接口,以支持用户查询大量数据的需求。在之前的版本中,Search 和 Query 接口对于数据量的限制较大,无法满足用户查询全量数据的需求。通过 Iterator 接口,用户可以通过动态调整 range 的方式,逐步获取所需的大批量数据。这一改进使得数据检索更加灵活和高效。
2. Delete By Expression 功能在 Milvus 2.3.0 之前的版本中,Delete 接口仅支持通过主键表达式进行数据删除,例如 ID in [1, 2, 3, ...]
。这导致用户在删除满足特定条件的数据时,需要先进行 Query 操作获取主键,然后再执行删除。Milvus 2.3.0 引入了 Delete By Expression 功能,允许用户直接在 Delete 操作中使用表达式来指定删除条件,从而简化了删除流程,提高了操作的便捷性。
3. 其他新增功能除了上述两个主要功能外,Milvus 2.3.0 还引入了以下改进:
- MMap:内存映射技术,提高数据读写效率。
- Growing Index:动态索引增长,优化索引管理。
- 动态配置修改:允许用户在运行时修改 Milvus 配置,增强系统的灵活性。
- CDC(Change Data Capture):支持数据变更捕获,便于数据同步和实时处理。
4. Milvus 在网易图文多模态场景的实践陈京分享了 Milvus 在网易图文多模态场景的应用实践。他指出,提升模型规模和数据质量是提高人工智能效果的关键。网易伏羲通过 5 年的研究,积累了丰富的算法和工程经验,开发了多个文本和多模态预训练模型。在这些模型中,向量(Embedding)扮演了核心角色,它能够将非结构化数据如文本、图像、音频和视频等映射到低维空间,以便于 AI 工具和算法的处理。
更多关于 Milvus 2.3.x 版本的详细信息,可以访问 Milvus 2.3.x 系列文章。
网易伏羲在图文数据检索领域面临诸多挑战,通过构建高性能、高可靠性的异构图文向量引擎,成功应对了这些挑战。以下是对挑战和解决方案的详细梳理:
挑战
- 资源占用高:检索系统需要消耗大量计算和存储资源。
- 异构资源:系统需要整合GPU、CPU、SSD等多种类型的资源。
- 业务类型复杂:涉及图文多模态、自然语言处理(NLP)、用户画像等多元化业务,每种业务对数据规模、时延、服务质量和召回精度有不同要求。
- 稳定性和可靠性:系统需要保证稳定运行和高可靠性。
解决方案为了应对上述挑战,网易伏羲选择了Milvus作为其图文向量引擎的架构。Milvus具备以下特点:
- 云原生:支持云环境,易于扩展和维护。
- 存储计算分离:存储和计算资源可以独立扩展,提高资源利用率。
- 分布式:支持分布式部署,增强系统的扩展性和容错性。
- 冗余和高可用:数据和计算任务具备冗余性,确保系统的高可用性。
通过Milvus架构的助力,网易伏羲成功创建了能够处理十亿级数据的Milvus集群,有效提升了图文检索的效率和准确性。
陈京来与伏羲的图文多模态探索
丹青模型与丹青约平台陈京来提到,在研发框架下,伏羲启动了图文多模态领域的能力积累和应用探索。他们自研了一款支持中文场景的图文生成模型——“丹青”。基于此模型,推出了AI绘画平台“丹青约”,为用户提供了一种全新的艺术创作方式。
技术融合与应用陈京来还提到了LangChain与Milvus的结合使用,这可以构建一个丹青约绘画Agent,进一步增强AI绘画平台的功能。
未来展望对于未来,陈京来有着明确的期待。他希望利用Milvus探索检索增强生成(RAG),以提升图文多模态模型的能力。同时,他也期待通过Milvus+的更多能力,推动图文多模态场景的应用落地。
KubeBlocks:AIGC 数据基础设施管理
管理AIGC数据的解决方案KubeBlocks提供了一种轻松管理AIGC数据基础设施的解决方案,旨在简化用户对数据的管理流程。
优化数据管理通过使用KubeBlocks,用户可以更加高效地处理和管理AIGC相关的数据,从而提高整个数据基础设施的运行效率。
面向未来KubeBlocks的设计理念是面向未来,它将随着AIGC技术的发展而不断进化,以满足用户日益增长的需求。
在AI时代,数据基础设施的管理和优化变得尤为重要。郭子昂在其演讲《KubeBlocks:轻松管理 AIGC 数据基础设施》中,详细介绍了KubeBlocks的解决方案。
KubeBlocks作为一个创新平台,通过提供向量数据库托管和LLM托管服务,为开发者提供了极大的便利。这不仅包括了对向量数据库的高效管理,还包括了对大型语言模型(LLM)的托管能力。这种托管服务,使得开发者能够更加专注于应用逻辑的实现,而不是底层数据管理的复杂性。
使用KubeBlocks,用户可以轻松构建自己的AI应用。平台的易用性大大降低了应用开发者的工作负担,使得他们能够快速地从概念验证阶段过渡到产品开发阶段。此外,KubeBlocks还提供了一系列的工具和接口,进一步简化了AI应用的开发流程。
总之,KubeBlocks的AIGC数据基础设施解决方案,为AI时代的应用开发提供了强有力的支持,是开发者构建智能应用的理想选择。
KubeBlocks 数据库托管能力分析
概述KubeBlocks 是一个开源的管控平台,它能够运行和管理 Kubernetes 上的数据库、消息队列以及其他数据基础设施。该平台支持多云和本地部署,提供快速集成和丰富的运维操作。
托管向量和图数据库
- 向量数据库托管:KubeBlocks 支持托管向量数据库如 Milvus,通过 API 定义 YAML 文件来配置数据库特性和运维配置,实现全生命周期管理。
- 图数据库托管:平台同样支持图数据库如 NebulaGraph,提供多云和线下部署的解决方案。
KubeBlocks 的 LLM 托管能力### LLMOps 能力KubeBlocks 具有强大的 LLMOps 能力,能够托管大型机器学习模型(LLM)并支持私有化部署。
- 私有化部署:开发者可以利用 KubeBlocks 实现 LLM 的私有化部署。
- 定制化大模型:支持定制化大模型,以适应特定行业数据的精细调整。
开发与生产环境适配
- 开发环境私有化:支持 LLM 开发环境的私有化部署。
- 分布式部署:实现分布式部署,以适应不同的计算需求。
- 高性能 batching:提高 GPU 利用率,适配本地开发和生产环境。
KubeChat —— KubeBlocks AIGC 解决方案落地KubeBlocks 成功开发了 AI 知识库应用 KubeChat,该应用在短短 10 天内完成,展示了 KubeBlocks 在开发 AI 应用时的高效性。
- 应对挑战:KubeChat 能够应对开发 AI 应用过程中的 Embedding、向量数据库和大模型等挑战。
结论KubeBlocks 以其强大的集成和抽象能力,为数据库和机器学习模型的托管提供了全面的解决方案,加速了 AI 应用的开发和部署。
点击下方链接,查看 KubeChat 演示视频:
04.
KCL 在 AI 工程配置策略场景的探索和落地使用
随着平台工程与人工智能工程的快速发展,我们面临着一系列挑战。以下是对《KCL 在 AI 工程配置策略场景的探索和落地使用》的重新梳理与解读:
1. 面临的挑战
- 认知负担日益加重
- 配置和数据种类繁多
- 数据清洗过程中容易出错
- 效率和可靠性不足
2. KCL 解决方案KCL 是一种专用的配置策略语言,它通过以下方式提供解决方案:
- 统一语言和工具集合
- 解决领域问题的无限变化和复杂性
- 平衡表达力和易用性
3. 核心能力KCL 以数据和模型为中心,提供以下核心能力:
- 通过记录和函数语言设计
- 配置(config)
- 建模抽象(schema)
- 逻辑(lambda)
- 策略(rule)
4. 特点
- 可复用和可扩展
- 抽象和组合能力
- 稳定性
- 高性能
KCL 的应用不仅提高了开发效率,同时也保证了配置的准确性和可靠性,为 AI 工程和云原生工程等场景提供了强大的支持。
KCL(Kimi Change Language)是一种广泛应用于多个领域的技术,其应用场景包括但不限于表格数据集的验证与转换、云原生配置的校验与适配、应用交付的抽象化处理、以及IaC(Infrastructure as Code)和GitOps的实践。KCL特别注重提升开发者的体验,为此提供了一套完整的工具链,包括语言支持、开发工具、集成开发环境、软件开发工具包以及插件等。此外,KCL还支持模型注册表(Model Registry),这为管理和共享模型提供了便利。
应用场景概览
- 表格数据集验证与转换:KCL能够对表格数据进行有效验证,并支持数据格式的转换。
- 云原生配置验证与转换:针对云原生环境的配置文件,KCL提供校验和适配转换功能。
- 应用交付抽象化:通过抽象化技术,KCL简化了应用交付流程。
- IaC & GitOps:KCL支持基础设施即代码和GitOps的实践,以实现自动化的基础设施管理和持续交付。
开发者体验
- 语言支持:KCL提供了丰富的语言特性,以满足不同开发者的需求。
- 开发工具:提供了一系列工具,帮助开发者更高效地进行开发。
- IDEs:集成开发环境支持,增强了开发体验。
- SDKs:软件开发工具包,为开发者提供了便捷的API调用。
- Plugins:插件支持,允许开发者根据自己的需求进行扩展。
模型注册表(Model Registry)KCL的模型注册表是一个集中管理和共享模型的平台,它允许用户注册、查找和使用各种模型。
彩蛋模型注册表中可能隐藏着一些有趣的模型,探索它可能会带来意想不到的发现。
回复关键词**【老友汇上海】**获取现场嘉宾 PPT。
推荐阅读
’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)
- 原文作者:知识铺
- 原文链接:https://index.zshipu.com/geek001/post/20240730/Milvus-%E8%80%81%E5%8F%8B%E6%B1%87AI%E4%BA%91%E5%8E%9F%E7%94%9F%E4%B8%8E%E5%90%91%E9%87%8F%E6%95%B0%E6%8D%AE%E5%BA%93%E7%9A%84%E7%A2%B0%E6%92%9E%E5%9B%9E%E9%A1%BE--%E7%9F%A5%E8%AF%86%E9%93%BA/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。
- 免责声明:本页面内容均来源于站内编辑发布,部分信息来源互联网,并不意味着本站赞同其观点或者证实其内容的真实性,如涉及版权等问题,请立即联系客服进行更改或删除,保证您的合法权益。转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。也可以邮件至 sblig@126.com