Gay*_*tri 2 nlp named-entity-recognition
我已经阅读了大量关于 Linear CRF 和 Word2Vec 的文章,想知道哪一个最适合进行命名实体识别。我使用斯坦福 NER(这是一个线性 CRF 实现)训练我的模型并获得了 85% 的精度。我知道 Word2vec 将相似的单词组合在一起,但它是做 NER 的好模型吗?
CRFs 和 word2vec 是苹果和橘子,所以比较它们没有意义。
CRF 用于序列标记问题,如 NER。给定一系列表示为特征并与标签配对的项目,他们将学习一个模型来预测新序列的标签。
Word2vec 的词嵌入是将词表示为浮点数向量。他们不会自己预测任何事情。您甚至可以使用词向量在 CRF 中构建特征,尽管将它们与 LSTM 等神经模型一起使用更为常见。
有些人已经成功地使用带有 CRF 的词向量。有关在 CRF 中使用词向量的一些讨论,请参见此处和此处。
请注意,在许多标准 CRF 实现中,特征应该是二进制或分类的,而不是连续的,因此您通常不能像插入另一个特征一样将词向量推入。
如果您想知道哪个更适合您的用例,找出答案的唯一方法是同时尝试两者。
| 归档时间: |
|
| 查看次数: |
2455 次 |
| 最近记录: |