sim*_*019 4 python-3.x jupyter-notebook tensorboard pytorch seq2seq
所以我正在尝试制作一个 seq to seq 模型,用于在 Kaggle Notebook 和 google colab 等在线笔记本上使用 pytorch 将德语翻译成英语
import torch
import torch.nn as nn
import torch.optim as optim
from torchtext.datasets import Multi30k
from torchtext.data import Field, BucketIterator
import numpy as np
import spacy
import random
from torch.utils.tensorboard import SummaryWriter # to print to tensorboard
Run Code Online (Sandbox Code Playgroud)
导入的库,当我使用 spacy 函数加载数据集时,如下所示,
spacy_ger = spacy.load("de")
spacy_eng = spacy.load("en")
Run Code Online (Sandbox Code Playgroud)
这个错误就来了。: OSError: [E050] 找不到型号“de”。它似乎不是快捷方式链接、Python 包或数据目录的有效路径。
到处都有对“en”的解释,但没有对“de”的解释。如果有人可以帮忙解决这个问题。
规格:
封装:版本
斯帕西:2.3.1
pytorch-crf:0.7.0
火炬:1.5.1
火炬nlp:0.0.0.1
火炬文本:0.4.0
火炬视觉:0.6.1
jupyter-张量板:0.2.0
张量板:2.2.2
张量板插件机智:1.7.0
预先感谢您的帮助。
因此,经过整整一个月的时间,尝试其他事情并探索与该主题相关的问题和问题,我找到了一种方法,
import spacy.cli
spacy.cli.download("en_core_web_md")
Run Code Online (Sandbox Code Playgroud)
使用此方法,您可以使用和导入任何 spacy 模型,无论是中等大小还是较大尺寸的数据集,如果您尝试使用导入数据集,它总是会给出错误,因为
spacy.load它对于加载 sm 或最小尺寸以外的数据集无效Google colab 或 Kaggle 笔记本或任何其他在线笔记本中的数据集。
| 归档时间: |
|
| 查看次数: |
7449 次 |
| 最近记录: |