我正试图在Keras的帮助下使用神经网络实现词性标注器.
我正在使用序列模型,并从NLTK的Penn Treebank语料库(即来自nltk.corpus导入树库)训练数据.根据我的理解,与Keras形成神经网络包括以下步骤:
具体来说,我不确定如何预处理标记的训练数据以便在我的模型中使用它?这些标记数据来自nltk的语料库,它们是键值对,键是英语单词,值是相应的POS标记.
确切地说,我不知道如何在以下代码中的"数据"和"标签"变量中排列数据:
model.fit(data, labels, nb_epoch=50, batch_size=32)
有人可以给我一些提示吗?非常感谢您的时间,我非常感谢您的帮助!
part-of-speech pos-tagger neural-network deep-learning keras