llama_index 获取node_sources引用的文档

ede*_*bin 9 llama-index

我使用具有索引 PDF 的 llama_index 获得了良好的结果,但是我无法找到它在哪个 PDF 中找到结果以作为其答案的基础。result.node_sources 使用似乎是内部生成的 Doc id。我怎样才能获得该文档的参考?

小智 4

直接从 Llama 团队得到了这个答案 -

感谢您的提问以及您对 LlamaIndex 的支持。您可以采取以下几种通用方法:

  • 将元数据注入到extra_info每个文档中,例如文件名、链接等。许多 LlamaHub 加载器应该已经自动将元数据添加到 extra_info 中,但如果您愿意,您可以自己添加/删除 extra_info 。这个 extra_info 被注入到每个节点中。当您从查询引擎获得响应时,您可以response.source_nodes获取相关源。

这些来源将包含原始文本和元数据。看看这个文档: https://gpt-index.readthedocs.io/en/stable/core_modules/data_modules/documents_and_nodes/usage_documents.html

  • 假设您将适当的元数据添加到字段中extra_info,您可以选择修改查询字符串或 QA/优化提示,并在其中之一中说出类似“请在答案中引用来源”之类的内容。

您只需附加查询字符串即可自定义提示,请查看https://gpt-index.readthedocs.io/en/latest/how_to/customization/custom_prompts.html