有哪些好的算法可以自动标记城市/地区或来源的文本?也就是说,如果博客是关于纽约的,我怎么能以编程方式讲述.是否有声称以任何确定程度这样做的包裹/文件?
我已经看过一些基于tfidf的方法,专有名词交叉点,但到目前为止,没有引人注目的成功,我很欣赏这些想法!
更一般的问题是关于为主题分配文本,给出一些主题列表.
简单/天真的方法比贝叶斯方法更完整,但我是开放的.
algorithm statistics nlp named-entity-recognition
algorithm ×1
named-entity-recognition ×1
nlp ×1
statistics ×1