相关疑难解决方法(0)

如何检测用户输入文本的语言?

我正在处理一个接受不同语言用户输入的应用程序(目前修复了3种语言).要求是用户可以输入文本,而不必费心通过UI中提供的复选框选择语言.

是否有现有的Java库来检测文本的语言?

我想要这样的东西:

text = "To be or not to be thats the question."

// returns ISO 639 Alpha-2 code
language = detect(text);

print(language);
Run Code Online (Sandbox Code Playgroud)

结果:

EN
Run Code Online (Sandbox Code Playgroud)

我不想知道如何自己创建一个语言检测器(我已经看到很多博客试图这样做).该库应提供简单的APi,并且完全脱机工作.开源或商业封闭并不重要.

我也在SO上发现了这个问题(还有一些):

如何检测语言
如何检测文本语言?

java nlp language-detection

40
推荐指数
3
解决办法
4万
查看次数

如何判断写入的纯文本文件是什么语言?

假设我们有一个内容文本文件:"Je suis un beau homme ......"

另一个:"我是一个勇敢的人"

第三个用德语发表文字:"Guten morgen.Wie geht's?"

我们如何编写一个告诉我们的函数:第一个文件中的文本是英文的,第二个文件是英文等等?

欢迎链接到书籍/开箱即用的解决方案.我用Java编写,但如果需要,我可以学习Python.

我的评论

  1. 我需要添加一个小评论.该文本可能包含不同语言的短语,作为整体的一部分或由于错误的结果.在经典文学中,我们有很多例子,因为贵族成员是多语言的.因此,概率更好地描述了情况,因为文本的大多数部分是用一种语言编写的,而其他部分可能用另一种语言编写.
  2. Google API - 互联网连接.我不想使用远程功能/服务,因为我需要自己做或使用可下载的库.我想就这个话题进行研究.

java nlp

25
推荐指数
3
解决办法
3533
查看次数

标签 统计

java ×2

nlp ×2

language-detection ×1