我正在处理一个接受不同语言用户输入的应用程序(目前修复了3种语言).要求是用户可以输入文本,而不必费心通过UI中提供的复选框选择语言.
是否有现有的Java库来检测文本的语言?
我想要这样的东西:
text = "To be or not to be thats the question."
// returns ISO 639 Alpha-2 code
language = detect(text);
print(language);
Run Code Online (Sandbox Code Playgroud)
结果:
EN
Run Code Online (Sandbox Code Playgroud)
我不想知道如何自己创建一个语言检测器(我已经看到很多博客试图这样做).该库应提供简单的APi,并且完全脱机工作.开源或商业封闭并不重要.
我也在SO上发现了这个问题(还有一些):
假设我们有一个内容文本文件:"Je suis un beau homme ......"
另一个:"我是一个勇敢的人"
第三个用德语发表文字:"Guten morgen.Wie geht's?"
我们如何编写一个告诉我们的函数:第一个文件中的文本是英文的,第二个文件是英文等等?
欢迎链接到书籍/开箱即用的解决方案.我用Java编写,但如果需要,我可以学习Python.
我的评论