标签: languagetool

寻找Java拼写检查库

我正在寻找一个开源Java拼写检查库,它至少包含以下语言的字典:法语,德语,西班牙语和捷克语.有什么建议吗?

java nlp spell-checking languagetool

53
推荐指数
2
解决办法
5万
查看次数

如何添加两个单词模式以供LanguageTool忽略?

情况:

作为尚未实现的功能的解决方法,将单词的用户词典添加到Languagetool,我想出了这段代码:

JLanguageTool langTool = new JLanguageTool(lang);
langTool.activateDefaultPatternRules();
List<Rule> rules = langTool.getAllActiveRules();
for (Rule rule:rules) {
    // System.out.println(rule.getId());
    if (rule.getId().equals("GERMAN_SPELLER_RULE")) {
        if (rule instanceof SpellingCheckRule) {
            SpellingCheckRule srule=(SpellingCheckRule) rule;
            String [] words={"word1", "word2"};
            List<String> tokens=new ArrayList<String>();
            for (String word:words) {
                tokens.add(word);
            }
            srule.addIgnoreTokens(tokens);
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

这将很好地添加由指定的单词列表

String [] words={"word1", "word2"};
Run Code Online (Sandbox Code Playgroud)

到被忽略的单词列表.但是如何组合单词/两个单词模式如"访客浴室","法语单词""测试应用程序" - 如何在不修改原始语法文件的情况下忽略这些?我假设创建一些用户定义的规则可以做到这一点,也可能是上面代码片段更优雅的解决方案.

题:

获取用户词典的工作方法是什么,忽略单词和双词短语?

java spell-checking languagetool

22
推荐指数
1
解决办法
859
查看次数

开源拼写检查

正在评估为我拥有的产品添加拼写检查.根据我的研究,需要做出的主要决定:

  1. 要使用的库.
  2. 字典(这可以是特定地区,英国英语,美国等).
  3. 排除列表.每当检测到拼写错误时,可能不是拼写错误,而是用户特有的措辞.此时,用户应该能够将其
    添加到他的自定义排除列表中.
  4. 除了每用户自定义列表外,还有基于工具客户端的用户空间的排除列表.这是用户工作域中的术语/首字母缩略词.例如,FX不会成为货币交易者的拼写错误.

下面列出了我所提出的开放性问题,如果我可以获得非常有用的输入.1,我想的是hunspell,它是在MPL下提供的开源库,由firefox和OpenOffice系列产品使用.有没有使用这个恐怖故事?有许可证的灰色区域?拼写检查将在Windows客户端上进行.

字典可以从各种来源获得,有些是免费的,而有些则不是.关于免费词典的良好来源的任何建议.

多语言支持以及需要制定哪些方面来支持他们?

对于4,自定义词典如何与服务器端和客户端保持同步?拼写检查需要在客户端进行,所以它们是否每次都在初始启动时被推下,或者它们是否经常同步?

nlp spell-checking languagetool

12
推荐指数
2
解决办法
9650
查看次数

是否有免费的德语形态分析库?

我正在寻找一个可以对德语单词进行形态分析的库,即它将任何单词转换为其根形式并提供有关所分析单词的元信息.

例如:

gegessen -> essen
wurde [...] gefasst -> fassen
Häuser -> Haus
Hunde -> Hund
Run Code Online (Sandbox Code Playgroud)

我的收藏:

  • 它必须与名词和动词一起使用.
  • 我知道鉴于德语的复杂性,这是一项非常艰巨的任务,因此我也在寻找仅提供近似值或可能只有80%准确度的库.
  • 我更喜欢不与字典一起工作的图书馆,但是考虑到这些情况,我愿意接受妥协.
  • 我也更喜欢C/C++/Delphi Windows库,因为这样可以更容易集成,但.NET,Java,...也可以.
  • 它必须是一个免费的图书馆.(L)GPL,MPL,......

编辑:我知道没有任何字典就没有办法进行形态分析,因为不规则的单词.当我说,我更喜欢没有字典的图书馆,我的意思是那些完整的字典,它们映射每一个字:

arbeite -> arbeiten
arbeitest -> arbeiten
arbeitet -> arbeiten
arbeitete -> arbeiten
arbeitetest -> arbeiten
arbeiteten -> arbeiten
arbeitetet -> arbeiten
gearbeitet -> arbeiten
arbeite -> arbeiten
... 
Run Code Online (Sandbox Code Playgroud)

这些词典有几个缺点,包括巨大的尺寸和无法处理未知单词.

当然,所有异常只能用字典处理:

esse -> essen
isst -> essen
eßt -> essen
aß -> essen
aßt -> essen
aßen -> essen
...
Run Code Online (Sandbox Code Playgroud)

(我的思绪现在正在旋转:))

morphological-analysis languagetool

8
推荐指数
2
解决办法
3209
查看次数

Java中的拼写检查和/或拼写纠正

如何在Java应用程序中进行拼写检查和/或拼写纠正?

java nlp spell-checking languagetool

7
推荐指数
1
解决办法
1万
查看次数

将单词添加到 languagetool 建议列表中

我在应用程序中使用 LanguageTool 进行一些拼写检查和拼写更正功能。

LanguageTool文档描述了如何从拼写检查中排除单词(通过调用addIgnoreTokens(...)您正在使用的拼写检查规则的方法)。

如何添加一些单词(例如,来自特定词典的单词)来进行拼写检查?也就是说,LanguageTool 可以修复拼写错误的单词并从我的特定词典中建议单词吗?

java spell-checking languagetool

5
推荐指数
1
解决办法
1899
查看次数

在LanguageTool中,如何创建字典并将其用于拼写检查?

如何使用语言工具创建用于拼写检查的字典?我不是Java程序员,这是我第一次看到LT。

java dictionary spell-checking languagetool

4
推荐指数
1
解决办法
1081
查看次数