实现本地RAG服务：整合Open WebUI、Ollama与Qwen2.5 -- 知识铺

2024年10月29日

aaaaaaa## 引言在构建信息检索和生成式 AI 应用时，Retrieval-Augmented Generation (RAG) 模型因其能够从知识库中检索相关信息并生成准确答案的能力而受到开发者们的欢迎。要实现端到端的本地 RAG 服务，不仅需要合适的模型，还需要集成用户友好的界面和高效的推理框架。通过使用易于部署的 Docker 方案，我们可以简……

阅读全文

安装Dify并集成Ollama和Xinference -- 知识铺

2024年10月29日

liuqianglong.com 本文介绍了通过Docker安装Dify，然后集成Ollama和XInference，并利用Dify快速搭建一个基于知识库问答的应用。一、Dify简介 Dify是一款开源的大语言模型（LLM）应用开发平台，旨在帮助开发者快速构建和部署生成式AI应用。以下是Dify的主要功能和特点[……

阅读全文

Docker中设置HTTP代理的方法 -- 知识铺

2024年10月29日

如果你需要在 Docker 中设置 HTTP 代理，可以通过设置环境变量来实现。以下是设置代理的步骤：设置环境变量：在你的 shell 会话中设置 HTTP_PROXY 和 HTTPS_PROXY 环境变量。例如： 1 2 export HTTP_PROXY="http://192.168.99.188:1080" export HTTPS_PROXY="http://192.168.99.188:1080" 如果你还需要设置 SOCKS 代理，可以设置 ALL_PROXY 环境变量： 1 export ALL_PROXY="socks5://192.168.99.188:1080" 配置 Docker 服务以自动使用代理设置如果你希望 Docker 服务在启动时自动应用代理设置，你需要将相应的环……

阅读全文

大模型 RAG 基础：信息检索、文本向量化及 BGE-M3 embedding 实践（2024） -- 知识铺 -- 知识铺

2024年10月29日

Published at 2024-08-04 | Last Update 2024-08-19 本文整理一些文本向量化（embedding）和信息检索的知识，它们是如今大模型生成文本时常用的技术 —— “增强检索生成”（RAG）—— 的基础：本文详细介绍了信息检索技术的发展阶段、不同类型的文本向量化（embedding）技术，以及如何将这些技术应用于增强检索生成（R……

阅读全文

在CentOS上安装NVIDIA容器工具包指南 -- 知识铺

2024年10月29日

安装 NVIDIA Container Toolkit 步骤指南以下是在 CentOS 7 上安装 NVIDIA Container Toolkit 的详细步骤： 1. 设置存储库和 GPG 密钥首先，您需要设置存储库和 GPG 密钥。请在终端执行以下命令： 1 distribution=$(. /etc/os-release;echo $ID$VERSION_ID) && curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.repo | sudo tee /etc/yum.repos.d/nvidia-container-toolkit.repo 2. 更新包列表并安装 nvidia-container-toolkit 包接下来，更新您的包列表并安装 nvidia-container-toolkit 包及其依赖项。 1 2 sudo yum clean expire-cache sudo yum install -y nvidia-container-toolkit 3. 配置 Docker 守护进程以识别 NVIDIA 容器运行时使用……

阅读全文

国外最受欢迎的15个健康网站 -- 知识铺

2024年10月29日

当前位置：首页 > 资讯 > 国外最受欢迎的15个健康网站资讯 WebMD是一家提供健康信息服务的美国公司。它于1996年由Jim Clark和Pavan Nigam创建的。起初公司叫Healtheon/WebMD，后来被缩短为WebMD。其纳斯达克股票代码为WBMD，总部为美国纽约市，共有1……

阅读全文

健康网站排名与排行榜 -- 知识铺

2024年10月29日

健康布谷医生网 _ aaaaaaa 布谷医生是一家权威的在线健康问答咨询平台，它汇聚了全国三甲医院的知名专家医生。该平台为患者提供了多样的服务形式，包括但不限于：科普讲解：提供专业的医疗知识普及，帮助用户了解疾病预防、健康管理等信息。免费咨询：支持用户就健康问题向专业医生进行免费咨询。图文咨询：除……

阅读全文

彻底搞懂大模型 - Dify（Agent + RAG） -- 知识铺

2024年10月29日

aaaaaaaDify 是一个专为构建AI应用程序而设计的开源平台，它结合了后端即服务（BaaS）与LLMOps的理念。该平台支持多种大型语言模型，包括但不限于Claude3和OpenAI系列，并与多家模型供应商保持合作，确保开发者能够根据具体需求选择最合适的模型。 aaaaaaaDify 提供了一系列工具和服务来简化AI应……

阅读全文

Xinference本地运行大模型bge-reranker-v2-m3教程 -- 知识铺

2024年10月29日

liuqianglong.com Xinference 本地运行大模型本文介绍了如何使用 Docker 部署 Xinference 推理框架，并演示了启动和运行多种大模型的过程，包括大语言模型、图像生成模型以及多模态模型。同时，还提供了关于嵌入和重排模型的启动指导，为后续 Dify 调用这些模型打下基础。一、Xinference 简介 Xorbits Inference (Xinference) 是一个开源分布式推理框架，专为执行大规……

阅读全文

RAG预处理增强：让FastgptDify召回更多东西 Menghuan1918's Blog -- 知识铺 -- 知识铺

2024年10月29日

目前的Fastgpt，Dify(或者其他同类产品)，目前知识库召回的本质上还是分片块的文本，召回的还是文本信息。不过，我们可以进行一些预处理，提升其召回精度的同时，使其也能同时召回将图片与公式表格等内容。原理以及实现已经将下文提到的所有预处理方法加到pdfdeal包里啦(需要0.……

阅读全文

知识铺的博客

实现本地RAG服务：整合Open WebUI、Ollama与Qwen2.5 -- 知识铺

安装Dify并集成Ollama和Xinference -- 知识铺

Docker中设置HTTP代理的方法 -- 知识铺

大模型 RAG 基础：信息检索、文本向量化及 BGE-M3 embedding 实践（2024） -- 知识铺 -- 知识铺

在CentOS上安装NVIDIA容器工具包指南 -- 知识铺

国外最受欢迎的15个健康网站 -- 知识铺

健康网站排名与排行榜 -- 知识铺

彻底搞懂大模型 - Dify（Agent + RAG） -- 知识铺

Xinference本地运行大模型bge-reranker-v2-m3教程 -- 知识铺

RAG预处理增强：让FastgptDify召回更多东西 Menghuan1918's Blog -- 知识铺 -- 知识铺

最近文章

分类

标签

友情链接

其它