Abt*_*Pst 8 nlp named-entity-recognition
在NLP中,有一个概念Gazetteer对于创建注释非常有用.据我所理解,
A gazetteer consists of a set of lists containing names of entities such as cities, organisations, days of the week, etc. These lists are used to ?nd occurrences of these names in text, e.g. for the task of named entity recognition.
所以它本质上是一个查找.这不是骗子吗?如果我们使用a Gazetteer来检测命名实体,那么就没有太多Natural Language Processing了.理想情况下,我想要使用NLP技术检测命名实体.否则它如何比正则表达式模式匹配器更好.
那有意义吗?
取决于您如何构建/使用您的地名词典.如果你在一个封闭的领域展示实验并且你定制选择你的地名录,那么是的,你是在作弊.如果您正在使用一些公开可用的地名词典并在大型数据集上执行实验或在野外应用程序中使用它而您无法控制输入,那么您就可以了.我们发现自己处于类似的情况.我们对数据集进行分区,并使用训练数据自动构建我们的地名录.只要你报告你的方法,你就不应该感到作弊(让评论者抱怨).