图片
一场久违的老友对谈,一次精妙的AI探索碰撞。 近日,Milvus老友汇·Arch Meetup在上海圆满落幕。本次Meetup亮点颇多,不仅得到了KubeBlocks社区的大力支持,而且邀请了来自网易伏羲和蚂蚁集团的资深专家,他们现场分享了各自对于AI时代云原生与向量数据库的深入思考。

活动概述

  • 活动名称:Milvus老友汇·Arch Meetup
  • 时间:近日
  • 地点:上海
  • 支持单位:KubeBlocks社区

特邀嘉宾

  • 网易伏羲的资深专家
  • 蚂蚁集团的资深专家

分享主题

  • AI时代下的云原生技术
  • 向量数据库的发展趋势与应用

活动亮点

  • 深入探讨了AI技术在云原生环境中的融合与应用。
  • 专家们分享了他们在AI领域多年的经验和见解。

结语Milvus老友汇·Arch Meetup为参与者提供了一个交流思想、分享经验的平台,促进了AI技术在云原生与向量数据库领域的进一步发展。

图片

图片

Milvus 2.3.x 版本新功能与实践分享

以下是对本次活动的主要内容进行的梳理和解读,以帮助大家更好地理解和吸收。

一、Milvus 2.3.x 版本介绍

1. 架构优势

  • Zilliz 资深工程师 夏琮祺 强调了 Milvus 2.3.x 在架构上的先进性,它在向量数据库领域具有显著的领先优势。

2. 新功能亮点

  • 夏琮祺还介绍了 Milvus 2.3.x 的新功能,这些功能将为用户带来更加丰富的使用体验。

3. 性能提升

  • 性能是 Milvus 2.3.x 的一大卖点,夏琮祺从多个角度分析了其性能的提升。

4. 可维护性

  • 夏琮祺指出,Milvus 2.3.x 在可维护性方面也做了很多优化,使得维护工作更加轻松。

二、Milvus 在网易伏羲的应用实践

1. 应用场景

  • 网易伏羲资深 AI 研发工程师 陈京来 分享了 Milvus 在网易图文多模态场景中的应用,展示了其在处理十亿级图文数据方面的强大能力。

2. 应用落地

  • 陈京来进一步阐述了 Milvus 如何支撑网易伏羲的应用落地,说明了其在实际业务中的重要性。

三、KubeBlocks 在向量数据库管理中的应用

1. KubeBlocks 工具介绍

  • 云猿生数据资深工程师 郭子昂 介绍了 KubeBlocks 工具,它能够简化向量数据库以及 AIGC 数据基础设施的管理。

2. 管理优势

  • 郭子昂强调了使用 KubeBlocks 管理向量数据库的便捷性,提升了管理效率。

四、KCL 在工程化配置策略中的应用

1. KCL 语言介绍

  • 蚂蚁集团工程师 徐鹏飞 介绍了 KCL 声明式配置语言,它在工程化配置策略中发挥着重要作用。

2. 应对挑战

  • 徐鹏飞分享了如何使用 KCL 应对工程化配置策略的挑战,提高了配置的灵活性和可维护性。

结语

本次活动涵盖了 Milvus 2.3.x 的新功能、应用实践以及相关工具的使用,为向量数据库和 AI 领域的专业人士提供了宝贵的信息和经验分享。
图片
Milvus 2.3.x 版本在架构上进行了显著升级,以增强其对异构硬件的支持,包括 GPU Index 采用 RAFT 技术,以及对 ARM 架构的适配。夏琮祺特别强调了 QueryNodeV2 的重要性,它作为 Milvus 系统中提供检索服务的核心组件,其稳定性、性能和扩展性对整个系统至关重要。QueryNodeV1 曾面临状态复杂、消息队列重复、代码结构不清晰和报错内容不直观等问题。QueryNodeV2 通过重新设计,实现了代码结构的优化,状态管理的简化,以及资源浪费的减少,使得其在稳定性测试中表现更加出色。 在新功能方面,Milvus 2.3.x 引入了一些值得关注的特性:

  • Upsert 操作:由于 Milvus 之前不支持 update 操作,用户需要通过删除旧记录并重新插入来更新向量。2.3 版本中,Upsert 接口的引入,提供了一种原子性的“修改”操作,简化了用户的操作流程。

  • SCANN Index 支持:Milvus 2.3.x 通过 Knowhere 2.0 支持了 SCANN 索引,这为系统提供了更高效的搜索能力。 QueryNodeV2 的升级和新功能的加入,不仅提升了 Milvus 的性能和用户体验,同时也为未来的技术发展奠定了基础。
    图片

Milvus 2.3.0 更新详解

1. Iterator 接口(仅限 pymilvus)

Milvus 2.3.0 版本在 pymilvus 中引入了 Iterator 接口,以支持用户查询大量数据的需求。在之前的版本中,Search 和 Query 接口对于数据量的限制较大,无法满足用户查询全量数据的需求。通过 Iterator 接口,用户可以通过动态调整 range 的方式,逐步获取所需的大批量数据。这一改进使得数据检索更加灵活和高效。

2. Delete By Expression 功能在 Milvus 2.3.0 之前的版本中,Delete 接口仅支持通过主键表达式进行数据删除,例如 ID in [1, 2, 3, ...]。这导致用户在删除满足特定条件的数据时,需要先进行 Query 操作获取主键,然后再执行删除。Milvus 2.3.0 引入了 Delete By Expression 功能,允许用户直接在 Delete 操作中使用表达式来指定删除条件,从而简化了删除流程,提高了操作的便捷性。

3. 其他新增功能除了上述两个主要功能外,Milvus 2.3.0 还引入了以下改进:

  • MMap:内存映射技术,提高数据读写效率。
  • Growing Index:动态索引增长,优化索引管理。
  • 动态配置修改:允许用户在运行时修改 Milvus 配置,增强系统的灵活性。
  • CDC(Change Data Capture):支持数据变更捕获,便于数据同步和实时处理。

4. Milvus 在网易图文多模态场景的实践陈京分享了 Milvus 在网易图文多模态场景的应用实践。他指出,提升模型规模和数据质量是提高人工智能效果的关键。网易伏羲通过 5 年的研究,积累了丰富的算法和工程经验,开发了多个文本和多模态预训练模型。在这些模型中,向量(Embedding)扮演了核心角色,它能够将非结构化数据如文本、图像、音频和视频等映射到低维空间,以便于 AI 工具和算法的处理。

更多关于 Milvus 2.3.x 版本的详细信息,可以访问 Milvus 2.3.x 系列文章
图片
网易伏羲在图文数据检索领域面临诸多挑战,通过构建高性能、高可靠性的异构图文向量引擎,成功应对了这些挑战。以下是对挑战和解决方案的详细梳理:

挑战

  1. 资源占用高:检索系统需要消耗大量计算和存储资源。
  2. 异构资源:系统需要整合GPU、CPU、SSD等多种类型的资源。
  3. 业务类型复杂:涉及图文多模态、自然语言处理(NLP)、用户画像等多元化业务,每种业务对数据规模、时延、服务质量和召回精度有不同要求。
  4. 稳定性和可靠性:系统需要保证稳定运行和高可靠性。

解决方案为了应对上述挑战,网易伏羲选择了Milvus作为其图文向量引擎的架构。Milvus具备以下特点:

  • 云原生:支持云环境,易于扩展和维护。
  • 存储计算分离:存储和计算资源可以独立扩展,提高资源利用率。
  • 分布式:支持分布式部署,增强系统的扩展性和容错性。
  • 冗余和高可用:数据和计算任务具备冗余性,确保系统的高可用性。 通过Milvus架构的助力,网易伏羲成功创建了能够处理十亿级数据的Milvus集群,有效提升了图文检索的效率和准确性。
    图片

陈京来与伏羲的图文多模态探索

丹青模型与丹青约平台陈京来提到,在研发框架下,伏羲启动了图文多模态领域的能力积累和应用探索。他们自研了一款支持中文场景的图文生成模型——“丹青”。基于此模型,推出了AI绘画平台“丹青约”,为用户提供了一种全新的艺术创作方式。

技术融合与应用陈京来还提到了LangChain与Milvus的结合使用,这可以构建一个丹青约绘画Agent,进一步增强AI绘画平台的功能。

未来展望对于未来,陈京来有着明确的期待。他希望利用Milvus探索检索增强生成(RAG),以提升图文多模态模型的能力。同时,他也期待通过Milvus+的更多能力,推动图文多模态场景的应用落地。

KubeBlocks:AIGC 数据基础设施管理

管理AIGC数据的解决方案KubeBlocks提供了一种轻松管理AIGC数据基础设施的解决方案,旨在简化用户对数据的管理流程。

优化数据管理通过使用KubeBlocks,用户可以更加高效地处理和管理AIGC相关的数据,从而提高整个数据基础设施的运行效率。

面向未来KubeBlocks的设计理念是面向未来,它将随着AIGC技术的发展而不断进化,以满足用户日益增长的需求。

图片
在AI时代,数据基础设施的管理和优化变得尤为重要。郭子昂在其演讲《KubeBlocks:轻松管理 AIGC 数据基础设施》中,详细介绍了KubeBlocks的解决方案。 KubeBlocks作为一个创新平台,通过提供向量数据库托管和LLM托管服务,为开发者提供了极大的便利。这不仅包括了对向量数据库的高效管理,还包括了对大型语言模型(LLM)的托管能力。这种托管服务,使得开发者能够更加专注于应用逻辑的实现,而不是底层数据管理的复杂性。 使用KubeBlocks,用户可以轻松构建自己的AI应用。平台的易用性大大降低了应用开发者的工作负担,使得他们能够快速地从概念验证阶段过渡到产品开发阶段。此外,KubeBlocks还提供了一系列的工具和接口,进一步简化了AI应用的开发流程。 总之,KubeBlocks的AIGC数据基础设施解决方案,为AI时代的应用开发提供了强有力的支持,是开发者构建智能应用的理想选择。
图片

KubeBlocks 数据库托管能力分析

概述KubeBlocks 是一个开源的管控平台,它能够运行和管理 Kubernetes 上的数据库、消息队列以及其他数据基础设施。该平台支持多云和本地部署,提供快速集成和丰富的运维操作。

托管向量和图数据库

  • 向量数据库托管:KubeBlocks 支持托管向量数据库如 Milvus,通过 API 定义 YAML 文件来配置数据库特性和运维配置,实现全生命周期管理。
  • 图数据库托管:平台同样支持图数据库如 NebulaGraph,提供多云和线下部署的解决方案。

KubeBlocks 的 LLM 托管能力### LLMOps 能力KubeBlocks 具有强大的 LLMOps 能力,能够托管大型机器学习模型(LLM)并支持私有化部署。

  • 私有化部署:开发者可以利用 KubeBlocks 实现 LLM 的私有化部署。
  • 定制化大模型:支持定制化大模型,以适应特定行业数据的精细调整。

开发与生产环境适配

  • 开发环境私有化:支持 LLM 开发环境的私有化部署。
  • 分布式部署:实现分布式部署,以适应不同的计算需求。
  • 高性能 batching:提高 GPU 利用率,适配本地开发和生产环境。

KubeChat —— KubeBlocks AIGC 解决方案落地KubeBlocks 成功开发了 AI 知识库应用 KubeChat,该应用在短短 10 天内完成,展示了 KubeBlocks 在开发 AI 应用时的高效性。

  • 应对挑战:KubeChat 能够应对开发 AI 应用过程中的 Embedding、向量数据库和大模型等挑战。

结论KubeBlocks 以其强大的集成和抽象能力,为数据库和机器学习模型的托管提供了全面的解决方案,加速了 AI 应用的开发和部署。

图片

点击下方链接,查看 KubeChat 演示视频:

04.

KCL 在 AI 工程配置策略场景的探索和落地使用

图片
随着平台工程与人工智能工程的快速发展,我们面临着一系列挑战。以下是对《KCL 在 AI 工程配置策略场景的探索和落地使用》的重新梳理与解读:

1. 面临的挑战

  • 认知负担日益加重
  • 配置和数据种类繁多
  • 数据清洗过程中容易出错
  • 效率和可靠性不足

2. KCL 解决方案KCL 是一种专用的配置策略语言,它通过以下方式提供解决方案:

  • 统一语言和工具集合
  • 解决领域问题的无限变化和复杂性
  • 平衡表达力和易用性

3. 核心能力KCL 以数据和模型为中心,提供以下核心能力:

  • 通过记录和函数语言设计
  • 配置(config)
  • 建模抽象(schema)
  • 逻辑(lambda)
  • 策略(rule)

4. 特点

  • 可复用和可扩展
  • 抽象和组合能力
  • 稳定性
  • 高性能 KCL 的应用不仅提高了开发效率,同时也保证了配置的准确性和可靠性,为 AI 工程和云原生工程等场景提供了强大的支持。
    图片
    KCL(Kimi Change Language)是一种广泛应用于多个领域的技术,其应用场景包括但不限于表格数据集的验证与转换、云原生配置的校验与适配、应用交付的抽象化处理、以及IaC(Infrastructure as Code)和GitOps的实践。KCL特别注重提升开发者的体验,为此提供了一套完整的工具链,包括语言支持、开发工具、集成开发环境、软件开发工具包以及插件等。此外,KCL还支持模型注册表(Model Registry),这为管理和共享模型提供了便利。

应用场景概览

  1. 表格数据集验证与转换:KCL能够对表格数据进行有效验证,并支持数据格式的转换。
  2. 云原生配置验证与转换:针对云原生环境的配置文件,KCL提供校验和适配转换功能。
  3. 应用交付抽象化:通过抽象化技术,KCL简化了应用交付流程。
  4. IaC & GitOps:KCL支持基础设施即代码和GitOps的实践,以实现自动化的基础设施管理和持续交付。

开发者体验

  • 语言支持:KCL提供了丰富的语言特性,以满足不同开发者的需求。
  • 开发工具:提供了一系列工具,帮助开发者更高效地进行开发。
  • IDEs:集成开发环境支持,增强了开发体验。
  • SDKs:软件开发工具包,为开发者提供了便捷的API调用。
  • Plugins:插件支持,允许开发者根据自己的需求进行扩展。

模型注册表(Model Registry)KCL的模型注册表是一个集中管理和共享模型的平台,它允许用户注册、查找和使用各种模型。

彩蛋模型注册表中可能隐藏着一些有趣的模型,探索它可能会带来意想不到的发现。

图片

回复关键词**【老友汇上海】**获取现场嘉宾 PPT。

推荐阅读


图片


图片

图片
’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)