在 colab 笔记本中运行 python 脚本,ModuleNotFoundError

sla*_*der 5 python google-colaboratory

Colab 新手,我正在尝试在此存储库中重现预训练 BERT 模型的微调: https://github.com/ncbi-nlp/ncbi_bluebert

我正在尝试使用以下代码运行 run_bluebert_ner.py 脚本(从其目录):

!python run_bluebert_ner.py --do_prepare=true \
 --task_name='bc5cdr' \
 --do_train=true \
 --do_eval=true \
 --do_predict=true  \
 --vocab_file=/content/ncbi_bluebert/bluebert_model/vocab.txt \
 --bert_config_file=/content/ncbi_bluebert/bluebert_model/bert_config.json \
 --init_checkpoint=/content/ncbi_bluebert/bluebert_model/bert_model.ckpt.data-00000-of-00001 \
 --data_dir=/content/ncbi_bluebert/data/BC5CDR \
 --num_train_epochs=1.0 \
 --do_lower_case=False \
 --output_dir=output
Run Code Online (Sandbox Code Playgroud)

这给了我这个错误消息:

Traceback (most recent call last):
  File "run_bluebert_ner.py", line 19, in <module>
    from bluebert.conlleval import evaluate, report_notprint
ModuleNotFoundError: No module named 'bluebert'
Run Code Online (Sandbox Code Playgroud)

我能够将 bluebert 中的内容导入并运行到笔记本本身。

通过 sys.path.extend 添加目录的绝对路径没有帮助。

经过一番搜索后,我尝试交替使用:

%run run_bluebert_ner.py --do_prepare=true \
 --task_name='bc5cdr' \
 --do_train=true \
 --do_eval=true \
 --do_predict=true  \
 --vocab_file=/content/ncbi_bluebert/bluebert_model/vocab.txt \
 --bert_config_file=/content/ncbi_bluebert/bluebert_model/bert_config.json \
 --init_checkpoint=/content/ncbi_bluebert/bluebert_model/bert_model.ckpt.data-00000-of-00001 \
 --data_dir=/content/ncbi_bluebert/data/BC5CDR \
 --num_train_epochs=1.0 \
 --do_lower_case=False \
 --output_dir=output
Run Code Online (Sandbox Code Playgroud)

这似乎至少找到了bluebert,但失败了:

AttributeError: only_check_args
Run Code Online (Sandbox Code Playgroud)

使用 FLAGS 删除所有标志。delattr没有帮助。

有没有人有什么建议?