读取文件 使用的 pdf 文档是一个 地址树模型的中文地址提取方法.pdf 文档,内容截图如下: 参数说明 基本的文档处理参数如下: chunk_overlap = 50 chunk_size = 250 embed_model = 'm3e-large' vs_type = 'fassi' zh_title_enhance = False 在进行文本处理时,合理设置参数对于确保信息完整性和处理效率至关重要。以下是对几个关键参数的详细解释: 文本块重叠量 (chunk_overlap): 此参数设置为50,意味……

阅读全文