标签: aspell

ASpell的好选择?

ASpell有什么好的替代品吗?这是一个很好的开源,但暂时没有更新.性能不太好,我在创建非字母字符的自定义工作清单时遇到问题.

spell-checking aspell

8
推荐指数
1
解决办法
2403
查看次数

使用ispell/aspell拼写检查camelcased单词

我需要拼写检查包含许多camelcased单词的大文档.我想要ispell或aspell来检查单个单词是否拼写正确.

所以,如果这个词:

ScientificProgrezGoesBoink

我很乐意建议这样做:

ScientificProgressGoesBoink

有没有办法做到这一点?(我的意思是,在Emacs缓冲区上运行它.)请注意,我不一定要它建议完整的替代方案.但是,如果它知道Progrez不被识别,我希望能够至少替换那个部分,或者将这个词添加到我的私人词典中,而不是将每个骆驼词包括在词典中.

emacs camelcasing aspell ispell

8
推荐指数
1
解决办法
1900
查看次数

聪明的方式使用aspell自动纠正通过?

我对aspell很新,但我只是想知道是否有办法使用aspell扫描文件并使用第一个建议自动更正所有错误.

automation spell-checking aspell

8
推荐指数
0
解决办法
662
查看次数

如何在aspell自定义词典上使用特殊字符?

我正在使用aspell和php(php-pspell)在内部搜索引擎上构建一个"你是说"的功能.

我有一个产品目录,我希望这些产品的名称也是字典中的单词,所以"你的意思是"可以建议'.

问题是,当我尝试使用PHP Pspell函数创建自定义词典时,如果单词包含不在az范围内的字符,如数字,hifens等,则会收到错误.

例如:

iphone 3gs:iphone顺利添加,但3gs不是

蓝光:由于 - 无法添加 -

是否可以在字典中添加这种单词?或aspell只是不接受他们?

php aspell

6
推荐指数
1
解决办法
1477
查看次数

适用于 Windows 的 Aspell 0.6

我正在寻找 Aspell 0.6 的 Win32 二进制版本。

我的印象是LyX 项目维护了 Aspell 的 Windows 分支(至少在 1.4 版之前),但我在任何地方都找不到它的版本。

windows open-source gnu aspell

6
推荐指数
1
解决办法
2376
查看次数

将字典添加到Aspell/Pspell

我已成功安装Aspell并使用Pspell编译PHP,一切似乎都运行正常.

我唯一无法做的就是创建一个"忽略"单词列表,或者个人字典,但是你要引用它.

我已经尝试了这里这里概述的步骤,但都没有任何效果.

如上面的链接和Aspell文档中所述,我尝试创建手册中概述的个人字典:

personal_ws-1.1 en 0
Rubiflex
quasirhombicosidodecahedron
Run Code Online (Sandbox Code Playgroud)

我将它放在aspell目录,我的主目录,根目录中,它从未被选中.Aspell文档实际上从未说明它应该存在的位置或者如何以其他方式加载它.

另一个参考是创建单个单词列表:

创建一个txt文件,其中包含您要添加到字典中的单词,其中每个单词都在一个单独的行上,然后运行以下命令:

 aspell --lang=en create master ./custom.rws < test.txt
Run Code Online (Sandbox Code Playgroud)

这将创建一个名为custom.rws的文件,该文件将包含字典的aspell编码字.只要扩展名为.rws,您就可以将文件命名为任意名称.现在将其添加到字典中,通过运行以下命令将custom.rws文件移动到字典位置/ usr/lib/aspell:

cp custom.rws /usr/lib/aspell/

要完成将其添加到字典,请通过运行以下命令将其更改为字典目录:

 cd /usr/lib/aspell/
 then edit the following file: nano en_US.multi
Run Code Online (Sandbox Code Playgroud)

并添加以下行:

add custom.rws

这些方法似乎都不起作用,我找不到任何关于如何正确添加字典或单词列表的明确示例.这是我能找到的两种最有前途的方法,但都没有效果.有谁知道我怎么能让Aspell使用我创建的个人字典文件?

感谢您的时间.

编辑:这里概述步骤对我有用.它们与此处列出的非常相似,除了后者指的是"en_US.multi",前者指的是"en.multi".将自定义列表添加到en.multi(而不是en_US.multi)后,它按预期工作.

php aspell pspell

6
推荐指数
1
解决办法
5235
查看次数

如何定义aspell单词分隔符?

Aspell将带有下划线或短划线的单词视为两个,例如,基于云的拼写检查为"云"和"基于".有没有办法指定单词分隔符以排除短划线和下划线?

bash spell-checking aspell

6
推荐指数
1
解决办法
845
查看次数

如何从Aspell的英国词典中删除单词

当我aspell(用英国词典)检查我的文本时,接受" froward " 这个词(因为它是一个真正的英语单词).但是我从不使用它,所以在我的文本中," froward "总是错误的" 向前 ".因此,我想aspell拒绝" fr "".

如何从Aspell的标准字典中删除单词?有没有办法创建单词的"黑名单"?没有办法将其标记 .aspell.en.pws,因为个人字典只包含"白名单".

spell-checking gnu aspell ispell

6
推荐指数
1
解决办法
233
查看次数

OCR最好的开源拼写检查程序?

我有大量来自19世纪的英文OCRed文档,并希望通过使用上下文拼写检查来清理一些OCR错误,例如Peter Norvig在http://norvig.com/spell-correct提出的算法..html.我的主要目标是能够使用概率模型(连同ocred文本数据和适当的大词典)来纠正错误拼写的单词.

我很高兴使用Norvig在他的网站上提供的代码并对其进行改进,但在此之前,我想问一下是否有一个开源解决方案.Norivg本人建议看看aspell,但我不认为aspell是一个上下文拼写检查器,我担心它可能在OCR纠错方面效果不好.

ocr spell-checking aspell

6
推荐指数
1
解决办法
1266
查看次数

在 AWS Lambda 上使用 Pyenchant,可以加载包但不能加载提供程序字典,已在 EC2 上从源代码进行编译并提取 .so 文件

我正在尝试在 AWS 上的 Lambda 函数中使用 Python 拼写检查库 Pyenchant。Pyenchant 是 C libenchant 库的包装器,而该库又依赖于来自 Aspell 等提供商的单词词典。

在 Lambda 上运行的 python 代码中,我能够成功导入已编译的 enchant 库以及 AWS Linux EC2 实例上的 C 库 (libenchant.so),并将输出复制到我的 Lambda 部署包。

然而,当 pyenchant 库在 Lambda 上运行时,它无法加载任何需要工作的单词词典。然后我使用以下命令在 EC2 实例上安装了 Aspell:

yum install aspell-en enchant-aspell
Run Code Online (Sandbox Code Playgroud)

然后,我将以下附加 .so 文件复制到部署包的 /lib 文件夹中:

  • libaspell.so
  • libenchant_aspell.so
  • libenchant_ispell.so
  • libenchant_myspell.so
  • libenchant.so

我很确定 libenchant_aspell.so 是实际的字典,但它没有拾取它,我不知道下一步该去哪里。

下面是我的 lambda_handler python 代码:

from __future__ import print_function
import os
import sys
import re
import enchant

enchant.set_param("enchant.aspell.dictionary.path","/var/task/lib")

def lambda_handler(event, context):

    print("# List available enchant dictionary …
Run Code Online (Sandbox Code Playgroud)

python aspell pyenchant enchant aws-lambda

5
推荐指数
1
解决办法
647
查看次数