带有NER-Tagger的TensorFlow

Max*_*Max 4 nlp tensorflow

我想知道是否有可能在张量流中使用自我训练模型命名实体识别.

有一个word2vec实现,但我找不到'经典'POS或NER标记.

谢谢你的帮助!

j31*_*rre 8

您可以调整序列到序列模型以进行NER标记.您的培训文本是编码器的源词汇/序列:

Yesterday afternoon , Mike Smith drove to New York .
Run Code Online (Sandbox Code Playgroud)

您的BIO/BILOU NER标签是NER标签解码器的目标词汇/序列:

O O O B_PER I_PER O O B_LOC I_LOC O
Run Code Online (Sandbox Code Playgroud)

或者使用POS标签到解码器进行POS标记:

NN NN ,  NNP NNP VBD TO NNP NNP . 
Run Code Online (Sandbox Code Playgroud)

[恕我直言,使用深度学习方法通​​常不需要将POS标记作为中间步骤,除非您特别需要这些功能作为输出.]

您可能希望关闭解码器的嵌入字.

这篇着名的论文将序列到序列模型应用于句法分析,它与POS和/或NER任务有一些相似之处:语法作为外语