小编GSo*_*uth的帖子

如何使用 Langchain 获得更详细的结果来源

我正在尝试使用 Langchain 和特定 URL 作为源数据来整理一个简单的“来源问答”。URL 由一个页面组成，其中包含大量信息。

问题是RetrievalQAWithSourcesChain只给我返回整个 URL 作为结果的来源，这在这种情况下不是很有用。

有没有办法获得更详细的源信息？也许页面上特定部分的标题？指向页面正确部分的可点击 URL 会更有帮助！

我有点不确定的生成是result source语言模型、URL 加载器的函数还是仅仅是RetrievalQAWithSourcesChain单独的。

我尝试过使用UnstructuredURLLoader和，SeleniumURLLoader希望更详细的数据读取和输入会有所帮助 - 遗憾的是没有。

相关代码摘录：

llm = ChatOpenAI(temperature=0, model_name='gpt-3.5-turbo')
chain = RetrievalQAWithSourcesChain.from_llm(llm=llm, retriever=VectorStore.as_retriever())

result = chain({"question": question})

print(result['answer'])
print("\n Sources : ",result['sources'] )

Run Code Online (Sandbox Code Playgroud)

python openai-api gpt-3 chatgpt-api langchain

GSo*_*uth

2023 06-15

6
推荐指数

1
解决办法

6571
查看次数