构建docker镜像时如何在gitlab runner中缓存spacy模型

Dul*_*oon 5 gitlab docker spacy

我使用 docker 和 gitlab。我的docker文件是这样的

FROM ubuntu:16.04
RUN apt-get update && apt-get install
RUN pip3 install wheel
RUN pip3 install spacy
RUN python3 -m spacy download en_core_web_md
Run Code Online (Sandbox Code Playgroud)

当我构建 docker 容器时,wheel 和 spacy 包会缓存在 GitLab 运行程序中,但 spacy 模型不会。

有没有办法在 GitLab 运行程序中缓存 en_core_web_md 模型,以便可以安装该模型而无需再次下载。

Dul*_*oon 5

找到了解决方案。不使用以下命令安装模型,

RUN python3 -m spacy download en_core_web_md
Run Code Online (Sandbox Code Playgroud)

首先,您需要下载模型

RUN pip3 download https://github.com/explosion/spacy-models/releases/download/en_core_web_md-2.2.0/en_core_web_md-2.2.0.tar.gz
Run Code Online (Sandbox Code Playgroud)

然后安装它。

RUN pip3 install /en_core_web_md-2.1.0.tar.gz
Run Code Online (Sandbox Code Playgroud)

当您重新运行管道时,模型将不会再次下载。