开源拼写检查

Her*_*arn 12 nlp spell-checking languagetool

正在评估为我拥有的产品添加拼写检查.根据我的研究,需要做出的主要决定:

  1. 要使用的库.
  2. 字典(这可以是特定地区,英国英语,美国等).
  3. 排除列表.每当检测到拼写错误时,可能不是拼写错误,而是用户特有的措辞.此时,用户应该能够将其
    添加到他的自定义排除列表中.
  4. 除了每用户自定义列表外,还有基于工具客户端的用户空间的排除列表.这是用户工作域中的术语/首字母缩略词.例如,FX不会成为货币交易者的拼写错误.

下面列出了我所提出的开放性问题,如果我可以获得非常有用的输入.1,我想的是hunspell,它是在MPL下提供的开源库,由firefox和OpenOffice系列产品使用.有没有使用这个恐怖故事?有许可证的灰色区域?拼写检查将在Windows客户端上进行.

字典可以从各种来源获得,有些是免费的,而有些则不是.关于免费词典的良好来源的任何建议.

多语言支持以及需要制定哪些方面来支持他们?

对于4,自定义词典如何与服务器端和客户端保持同步?拼写检查需要在客户端进行,所以它们是否每次都在初始启动时被推下,或者它们是否经常同步?

Tho*_*fer 10

如前所述,Hunspell是最先进的拼写检查程序.它是Open Office,Thunderbird,Firefox和Google Chrome拼写检查程序.提供所有主要编程语言的端口.它适用于Open Office目录,因此支持许多语言.


Zif*_*fre 3

我用Hunspell做过一些事情,但我并没有遇到任何关于它的恐怖故事。虽然我只将它与英语(美国)一起使用,但它声称可以与其他语言一起使用。

至于许可,它提供了 GPL、LGPL 和 MPL 的选择。如果您不喜欢 MPL,您随时可以选择使用 LGPL。