Don*_*per 5 continuous-integration docker gitlab-ci dvc
我正在尝试使用 Gitlab CI/CD 构建并运行我的 Docker 映像,但有一个问题我无法解决,即使本地一切正常。
这是我的 Dockerfile:
FROM <internal_docker_repo_image>
RUN apt update && \
apt install --no-install-recommends -y build-essential gcc
COPY requirements.txt /requirements.txt
RUN pip install --no-cache-dir --user -r /requirements.txt
COPY . /src
WORKDIR /src
ENTRYPOINT ["python", "-m", "dvc", "repro"]
Run Code Online (Sandbox Code Playgroud)
这就是我运行容器的方式:
docker run --volume ${PWD}:/src --env=GOOGLE_APPLICATION_CREDENTIALS=<path_to_json> <image_name> ./dvc_configs/free/dvc.yaml --force
在本地运行时一切正常,但在 Gitlab CI/CD 上运行时会失败。
stages:
- build_image
build_image:
stage: build_image
image: <internal_docker_repo_image>
script:
- echo "Building Docker image..."
- mkdir ~/.docker
- cat $GOOGLE_CREDENTIALS > ${CI_PROJECT_DIR}/key.json
- docker build . -t <image_name>
- docker run --volume ${PWD}:/src --env=GOOGLE_APPLICATION_CREDENTIALS=<path_to_json> <image_name> ./dvc_configs/free/dvc.yaml --force
artifacts:
paths:
- "./data/*csv"
expire_in: 1 week
Run Code Online (Sandbox Code Playgroud)
这会导致以下错误:
ERROR: you are not inside of a DVC repository (checked up to mount point '/src')
以防万一您不知道 DVC 是什么,这是机器学习中使用的一种工具,用于对模型、数据集、指标进行版本控制,此外还可以设置管道(在我的案例中我使用它)。
本质上,它需要两个文件夹.dvc以及执行的.git目录dvc repro。
在这种特殊情况下,我不知道为什么它无法运行此命令,因为文件夹的内容完全相同并且都.dvc存在.git。
提前致谢!
您的问题与未使用 Docker COPY 复制隐藏文件 .env 的COPY . /src原因相同。您可能需要在您的.!.dvc.dockerignore
此外,docker run --volume ${PWD}:/src将覆盖容器/src,因此$PWD其本身将需要.git等。.dvc在运行这些命令之前,您似乎没有克隆存储库script。