2024年8月20日
向量检索技术是一种高效的搜索方法,广泛应用于多个领域。以下是对这项技术的详细解析以及其应用场景的梳理。 向量检索技术概述向量检索技术允许我们在向量空间中快速找到与查询向量最相似的向量。这项技术通常基于度量方式,如欧式距离,实现相似向量的搜索。在实际应用中,非结构化数据如文本、图像和……
阅读全文
2024年8月20日
语义搜索和检索增强生成(RAG)的革命性影响 随着技术的不断进步,语义搜索和检索增强生成(RAG)正在彻底改变我们与互联网的互动方式。这种变革背后的核心技术之一就是向量数据库。选择合适的向量数据库对于满足特定需求至关重要。本文将提供对四个主要开源向量数据库的全面比较,以帮助您做出明……
阅读全文
2024年8月20日
深度学习环境搭建问题解决方案 问题描述在使用虚拟机运行深度学习模型时,遇到了CUDA与PyTorch不兼容的问题,具体报错为:AssertionError: Torch not compiled with CUDA enabled。此外,虚拟机无法使用主机的GPU资源。针对这种情况,我们采取了以下步骤进行解决: 1. 确认系统和硬件配置……
阅读全文
2024年8月20日
使用conda安装第三方包时遇到CondaSSLError的解决方法 在使用conda安装第三方包,例如pytorch时,可能会遇到一个错误,即CondaSSLError。这个错误提示OpenSSL在当前机器上不可用,而OpenSSL是下载和安装包所必需的。以下是解决这个问题的步骤……
阅读全文
2024年8月20日
今天使用LlamaIndex AI框架构建一个简单的RAG应用程序,这个应用程序可以对私人文档进行上下文回答,同时这个程序还通过内存增强功能,可以基于之前的上下文进行回复。 基于LLMs的RAG概述 Retrieval-Augmented Generation(RAG)是一种先进的技术,它通过将外部知识库整合到大型语言模型……
阅读全文
2024年8月20日
论文题目:Large Language Models: A Survey 大语言模型综述 引言本文由著名学者Tomas Mikolov等人撰写,全面回顾和分析了大语言模型(LLMs)的发展历程、类型及其构建方法。 语言模型的发展历程 统计语言模型:早期的语言模型,基于统计学原理构建。 神经网络模型:引入神经网络技术,提高语言模型的表达……
阅读全文
2024年8月20日
MedGraphRAG: 基于图的检索增强生成框架在医疗领域的应用 摘要MedGraphRAG是一个新型框架,专为医疗领域设计,通过增强大型语言模型(LLM)的能力,生成基于证据的结果,提高处理私人医疗数据时的安全性和可靠性。该框架采用混合静态语义的文档分块方法,创建三层层次图结构,链接实体到医学知识,并……
阅读全文
2024年8月19日
田昕晖:ByteHouse技术专家 田昕晖,ByteHouse技术专家,拥有北京大学本科学位和中国科学院大学计算技术研究所博士学位,专注于分布式图计算领域。在分布式系统研究领域积累了丰富经验,近两年致力于分析型数据库与向量检索技术的研究与开发,在火山引擎ByteHouse团队负责向……
阅读全文
2024年8月19日
最近,大型语言模型(LLM)的兴起引发了人们对RAG系统的浓厚兴趣。许多从业人员都渴望了解RAG如何为自己的组织带来益处,一些企业已经发布了基于RAG的服务。本文将探讨RAG系统的一些局限性。 从语义检索开始 首先做个实验。下面的代码比较了查询内容与一系列语句的余弦相似度得分。它使用……
阅读全文
2024年8月19日
大家好,我是雨飞 在之前的文章中,我们讨论了GraphRAG的热门话题,并计划进行一次深入的分享。为了帮助大家更好地理解GraphRAG,我们将从基础知识入手,逐步深入到更高级的概念。 分享概览 GraphRAG简介 什么是GraphRAG? GraphRAG的重要性和应用场景。 知识图谱基……
阅读全文