我正在寻找一个开源Java拼写检查库,它至少包含以下语言的字典:法语,德语,西班牙语和捷克语.有什么建议吗?
情况:
作为尚未实现的功能的解决方法,将单词的用户词典添加到Languagetool,我想出了这段代码:
JLanguageTool langTool = new JLanguageTool(lang);
langTool.activateDefaultPatternRules();
List<Rule> rules = langTool.getAllActiveRules();
for (Rule rule:rules) {
// System.out.println(rule.getId());
if (rule.getId().equals("GERMAN_SPELLER_RULE")) {
if (rule instanceof SpellingCheckRule) {
SpellingCheckRule srule=(SpellingCheckRule) rule;
String [] words={"word1", "word2"};
List<String> tokens=new ArrayList<String>();
for (String word:words) {
tokens.add(word);
}
srule.addIgnoreTokens(tokens);
}
}
}
Run Code Online (Sandbox Code Playgroud)
这将很好地添加由指定的单词列表
String [] words={"word1", "word2"};
Run Code Online (Sandbox Code Playgroud)
到被忽略的单词列表.但是如何组合单词/两个单词模式如"访客浴室","法语单词""测试应用程序" - 如何在不修改原始语法文件的情况下忽略这些?我假设创建一些用户定义的规则可以做到这一点,也可能是上面代码片段更优雅的解决方案.
题:
获取用户词典的工作方法是什么,忽略单词和双词短语?
正在评估为我拥有的产品添加拼写检查.根据我的研究,需要做出的主要决定:
下面列出了我所提出的开放性问题,如果我可以获得非常有用的输入.1,我想的是hunspell,它是在MPL下提供的开源库,由firefox和OpenOffice系列产品使用.有没有使用这个恐怖故事?有许可证的灰色区域?拼写检查将在Windows客户端上进行.
字典可以从各种来源获得,有些是免费的,而有些则不是.关于免费词典的良好来源的任何建议.
多语言支持以及需要制定哪些方面来支持他们?
对于4,自定义词典如何与服务器端和客户端保持同步?拼写检查需要在客户端进行,所以它们是否每次都在初始启动时被推下,或者它们是否经常同步?
我正在寻找一个可以对德语单词进行形态分析的库,即它将任何单词转换为其根形式并提供有关所分析单词的元信息.
例如:
gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
Run Code Online (Sandbox Code Playgroud)
我的收藏:
编辑:我知道没有任何字典就没有办法进行形态分析,因为不规则的单词.当我说,我更喜欢没有字典的图书馆,我的意思是那些完整的字典,它们映射每一个字:
arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
...
Run Code Online (Sandbox Code Playgroud)
这些词典有几个缺点,包括巨大的尺寸和无法处理未知单词.
当然,所有异常只能用字典处理:
esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
Run Code Online (Sandbox Code Playgroud)
(我的思绪现在正在旋转:))
如何在Java应用程序中进行拼写检查和/或拼写纠正?
我在应用程序中使用 LanguageTool 进行一些拼写检查和拼写更正功能。
LanguageTool文档描述了如何从拼写检查中排除单词(通过调用addIgnoreTokens(...)您正在使用的拼写检查规则的方法)。
如何添加一些单词(例如,来自特定词典的单词)来进行拼写检查?也就是说,LanguageTool 可以修复拼写错误的单词并从我的特定词典中建议单词吗?
如何使用语言工具创建用于拼写检查的字典?我不是Java程序员,这是我第一次看到LT。