目前的Fastgpt,Dify(或者其他同类产品),目前知识库召回的本质上还是分片块的文本,召回的还是文本信息。不过,我们可以进行一些预处理,提升其召回精度的同时,使其也能同时召回将图片与公式表格等内容。 原理以及实现 已经将下文提到的所有预处理方法加到pdfdeal包里啦(需要0.……

阅读全文