认识短文的语言?

Rad*_*Hex 20 python nlp

我有一个文章列表,每篇文章都有自己的标题和描述.不幸的是,从我使用的来源,没有办法知道他们写的是什么语言.

此外,该文本并非完全用一种语言书写; 几乎总是英语单词存在.

我估计我需要存储在我的机器上的字典数据库,但感觉有点不切实际.你有什么建议我这样做?

Ale*_*lli 15

我会使用猜语语言项目.

编辑:现在在Bitbucket

  • 请注意,链接的guess_language现在没有维护,并链接到[Python2和Python3的fork](https://bitbucket.org/spirit/guess_language). (3认同)