无法 dockerize mlflow

Aka*_*bey 6 docker mlflow

在 dockerizing mlflow 时,只有 .trash 被创建,因为在 mlflow ui 中,出现“没有实验存在”的错误

dockerfile

FROM python:3.7.0

RUN pip install mlflow==1.0.0

WORKDIR /data

EXPOSE 5000

CMD mlflow server \
    --backend-store-uri /data/ \
    --default-artifact-root /data/ \
    --host 0.0.0.0
Run Code Online (Sandbox Code Playgroud)

码头工人:

  mlflow:
    # builds track_ml Dockerfile
    build:
      context: ./mlflow_dockerfile
    expose: 
      - "5000"
    ports:
      - "5000:5000"
    volumes: 
      - ./data:/data
Run Code Online (Sandbox Code Playgroud)

Adi*_*iii 10

你可以使用这个 Dockerfile,取自mlflow-workshop,它更通用,支持不同的 ENV 来调试和使用不同的版本。

默认情况下,它会将工件和文件存储在 /opt/mlflow 中。可以定义以下变量:

MLFLOW_HOME (/opt/mlflow)
MLFLOW_VERSION (0.7.0)
SERVER_PORT (5000)
SERVER_HOST (0.0.0.0)
FILE_STORE (${MLFLOW_HOME}/fileStore)
ARTIFACT_STORE (${MLFLOW_HOME}/artifactStore)
Run Code Online (Sandbox Code Playgroud)

文件

FROM python:3.7.0
LABEL maintainer="Albert Franzi"

ENV MLFLOW_HOME /opt/mlflow
ENV MLFLOW_VERSION 0.7.0
ENV SERVER_PORT 5000
ENV SERVER_HOST 0.0.0.0
ENV FILE_STORE ${MLFLOW_HOME}/fileStore
ENV ARTIFACT_STORE ${MLFLOW_HOME}/artifactStore

RUN pip install mlflow==${MLFLOW_VERSION} && \
    mkdir -p ${MLFLOW_HOME}/scripts && \
    mkdir -p ${FILE_STORE} && \
    mkdir -p ${ARTIFACT_STORE}

COPY scripts/run.sh ${MLFLOW_HOME}/scripts/run.sh
RUN chmod +x ${MLFLOW_HOME}/scripts/run.sh

EXPOSE ${SERVER_PORT}/tcp

VOLUME ["${MLFLOW_HOME}/scripts/", "${FILE_STORE}", "${ARTIFACT_STORE}"]

WORKDIR ${MLFLOW_HOME}

ENTRYPOINT ["./scripts/run.sh"]

Run Code Online (Sandbox Code Playgroud)

脚本/运行.sh

#!/bin/sh

mlflow server \
    --file-store $FILE_STORE \
    --default-artifact-root $ARTIFACT_STORE \
    --host $SERVER_HOST \
    --port $SERVER_PORT
Run Code Online (Sandbox Code Playgroud)

启动 MLFlow 跟踪 Docker

docker build -t my_mflow_image .
docker run -d -p 5000:5000 --name mlflow-tracking my_mflow_image
Run Code Online (Sandbox Code Playgroud)

运行培训

由于我们的 MLflow Tracking docker 暴露在 5000,我们可以通过设置环境变量 MLFLOW_TRACKING_URI 来记录执行情况。

MLFLOW_TRACKING_URI=http://localhost:5000 python example.py
Run Code Online (Sandbox Code Playgroud)

此外,最好- ./data:/data在第一次运行时删除,在不挂载的情况下进行调试,并且建议您可能需要根据需要挂载 ENV 中提到的不同路径。