如何确保用户只提交英文文本

btw*_*tw0 9 javascript python nlp

我正在构建一个涉及自然语言处理的项目,因为nlp模块目前只处理英文文本,所以我必须确保用户提交的内容(不长,只有几个单词)是英文的.是否有既定的方法来实现这一目标?Python或Javascript方式首选.

Pat*_*Pat 7

如果内容足够长,我会建议对字母进行一些频率分析.

但是,我认为最好的办法是将它们与英语词典进行比较,如果其中一半匹配则接受输入.

  • @Tyson,很棒,我没想过的另一个优势;-) (3认同)

Tah*_*tar 5

我认为最有效的方法是要求用户只提交英文文本:)

您可以使用英语/其他作为选项在文本区域上显示语言选择下拉列表.当用户选择"其他"时,禁用文本区域,并显示仅支持英语的消息[此刻].


Pra*_*ogg 5

Google有一个javascript API,它具有语言检测功能.我只玩过测试,从未在生产中使用它.

http://code.google.com/apis/ajaxlanguage/documentation/#Detect