小编jvl*_*mtc的帖子

使用 python dash 应用程序运行 langchain 问答机器人时出现 CUDA 内存问题：如何修复“torch.cuda.OutOfMemoryError”？

构建 langchain 问答机器人并提供 python dash 应用程序。

错误：

torch.cuda.OutOfMemoryError：CUDA 内存不足。尝试分配 64.00 MiB（GPU 0；4.00 GiB 总容量；已分配 3.44 GiB；0 字节可用；PyTorch 总共保留 3.44 GiB）

如果保留内存是 >> 已分配内存，请尝试设置 max_split_size_mb 以避免碎片。请参阅内存管理和 PYTORCH_CUDA_ALLOC_CONF 的文档

在CPU上运行良好；尝试让 CUDA 发挥可扩展性。

我尝试过的：

设置PYTORCH_CUDA_ALLOC_CONF为 512mb。
介绍batch_size=1;.
在 chain_type 的“stuff”和“map_reduce”之间切换。

上述都没有解决问题。

vector_db = Chroma(
    persist_directory = "",
    embedding_function = HuggingFaceInstructEmbeddings(
        model_name = "hkunlp/instructor-xl",
        model_kwargs = {
            "device": "cuda"
        }))

llm = AzureOpenAI("",batch_size=1)

qa_chain = RetrievalQA.from_chain_type(
    llm = llm, chain_type = "map_reduce",
    retriever = vector_db.as_retriever(
        search_kwargs = {
            'k': 1 …

Run Code Online (Sandbox Code Playgroud)

python plotly-dash langchain

jvl*_*mtc

2023 05-30

6
推荐指数

0
解决办法

1110
查看次数

标签统计

langchain ×1

plotly-dash ×1

python ×1

使用 python dash 应用程序运行 langchain 问答机器人时出现 CUDA 内存问题：如何修复“torch.cuda.OutOfMemoryError”？

标签 统计

小编jvl_mtc的帖子

标签统计