迭代 Torchtext.data.BucketIterator 对象会抛出 AttributeError 'Field' 对象没有属性 'vocab'

Question

迭代 Torchtext.data.BucketIterator 对象会抛出 AttributeError 'Field' 对象没有属性 'vocab'

Ein*_*hen 5 python iterator pytorch torchtext

当我尝试通过打印对象的下一个迭代来查看批次时BucketIterator，AttributeError会抛出。

tv_datafields=[("Tweet",TEXT), ("Anger",LABEL), ("Fear",LABEL), ("Joy",LABEL), ("Sadness",LABEL)]
train, vld = data.TabularDataset.splits(path="./data/", train="train.csv",validation="test.csv",format="csv", fields=tv_datafields)

train_iter, val_iter = BucketIterator.splits(
(train, vld),
batch_sizes=(64, 64),
device=-1,
sort_key=lambda x: len(x.Tweet),
sort_within_batch=False,
repeat=False
)
print(next(iter(train_dl)))

Run Code Online (Sandbox Code Playgroud)

Answer 1

mau*_*ion 1

我不确定您遇到的具体错误，但在这种情况下，您可以使用以下代码迭代批次：

for i in train_iter:
    print i.Tweet
    print i.Anger
    print i.Fear
    print i.Joy
    print i.Sadness

Run Code Online (Sandbox Code Playgroud)

i.Tweet（还有其他）是形状的张量(input_data_length, batch_size)。

因此，要查看单个批次数据（假设批次 0），您可以执行以下操作print i.Tweet[:,0]：

val_iter（和test_iter，如果需要的话）也是如此。

归档时间：	7 年，7 月前
查看次数：	5969 次
最近记录：	7 年，4 月前