小编jvl*_*mtc的帖子

使用 python dash 应用程序运行 langchain 问答机器人时出现 CUDA 内存问题:如何修复“torch.cuda.OutOfMemoryError”?

构建 langchain 问答机器人并提供 python dash 应用程序。

错误:

torch.cuda.OutOfMemoryError:CUDA 内存不足。尝试分配 64.00 MiB(GPU 0;4.00 GiB 总容量;已分配 3.44 GiB;0 字节可用;PyTorch 总共保留 3.44 GiB)

如果保留内存是 >> 已分配内存,请尝试设置 max_split_size_mb 以避免碎片。请参阅内存管理和 PYTORCH_CUDA_ALLOC_CONF 的文档

在CPU上运行良好;尝试让 CUDA 发挥可扩展性。

我尝试过的:

  1. 设置PYTORCH_CUDA_ALLOC_CONF为 512mb。
  2. 介绍batch_size=1;.
  3. 在 chain_type 的“stuff”和“map_reduce”之间切换。

上述都没有解决问题。

vector_db = Chroma(
    persist_directory = "",
    embedding_function = HuggingFaceInstructEmbeddings(
        model_name = "hkunlp/instructor-xl",
        model_kwargs = {
            "device": "cuda"
        }))

llm = AzureOpenAI("",batch_size=1)

qa_chain = RetrievalQA.from_chain_type(
    llm = llm, chain_type = "map_reduce",
    retriever = vector_db.as_retriever(
        search_kwargs = {
            'k': 1 …
Run Code Online (Sandbox Code Playgroud)

python plotly-dash langchain

6
推荐指数
0
解决办法
1110
查看次数

标签 统计

langchain ×1

plotly-dash ×1

python ×1