我正在尝试通过翻译 nltk 3.0 for python 3 中的整个西班牙语语料库来创建我自己的数字西班牙语到英语数据库。我正在使用 Google 工具包进行翻译,结果证明这是一个非常缓慢的过程。我想知道是否存在可以在 python 3 中导入和使用的西班牙语到英语词典(最好是模块形式)。下面是我必须手动进行翻译的代码。到目前为止,每 5000 次翻译大约需要 12.5 分钟。
import goslate
import nltk
import pickle
x = pickle.load(open( "espcorpus.pickle", "rb" ))
gs = goslate.Goslate()
y = len(x)
y = y-1
print(y)
z = 0
b = []
n = 0
error = 0
import pickle
while z < 192683:
n = n + 1
while -1 < z < (4481*n):
try:
c = gs.translate(x[z], 'en', 'es')
word=nltk.word_tokenize(c)
c = nltk.pos_tag(word)
b.append(c[0])
print(z)
z …Run Code Online (Sandbox Code Playgroud)