ASpell有什么好的替代品吗?这是一个很好的开源,但暂时没有更新.性能不太好,我在创建非字母字符的自定义工作清单时遇到问题.
我需要拼写检查包含许多camelcased单词的大文档.我想要ispell或aspell来检查单个单词是否拼写正确.
所以,如果这个词:
ScientificProgrezGoesBoink
我很乐意建议这样做:
ScientificProgressGoesBoink
有没有办法做到这一点?(我的意思是,在Emacs缓冲区上运行它.)请注意,我不一定要它建议完整的替代方案.但是,如果它知道Progrez不被识别,我希望能够至少替换那个部分,或者将这个词添加到我的私人词典中,而不是将每个骆驼词包括在词典中.
我对aspell很新,但我只是想知道是否有办法使用aspell扫描文件并使用第一个建议自动更正所有错误.
我正在使用aspell和php(php-pspell)在内部搜索引擎上构建一个"你是说"的功能.
我有一个产品目录,我希望这些产品的名称也是字典中的单词,所以"你的意思是"可以建议'.
问题是,当我尝试使用PHP Pspell函数创建自定义词典时,如果单词包含不在az范围内的字符,如数字,hifens等,则会收到错误.
例如:
iphone 3gs:iphone顺利添加,但3gs不是
蓝光:由于 - 无法添加 -
是否可以在字典中添加这种单词?或aspell只是不接受他们?
我正在寻找 Aspell 0.6 的 Win32 二进制版本。
我的印象是LyX 项目维护了 Aspell 的 Windows 分支(至少在 1.4 版之前),但我在任何地方都找不到它的版本。
我已成功安装Aspell并使用Pspell编译PHP,一切似乎都运行正常.
我唯一无法做的就是创建一个"忽略"单词列表,或者个人字典,但是你要引用它.
如上面的链接和Aspell文档中所述,我尝试创建手册中概述的个人字典:
personal_ws-1.1 en 0
Rubiflex
quasirhombicosidodecahedron
Run Code Online (Sandbox Code Playgroud)
我将它放在aspell目录,我的主目录,根目录中,它从未被选中.Aspell文档实际上从未说明它应该存在的位置或者如何以其他方式加载它.
另一个参考是创建单个单词列表:
创建一个txt文件,其中包含您要添加到字典中的单词,其中每个单词都在一个单独的行上,然后运行以下命令:
Run Code Online (Sandbox Code Playgroud)aspell --lang=en create master ./custom.rws < test.txt这将创建一个名为custom.rws的文件,该文件将包含字典的aspell编码字.只要扩展名为.rws,您就可以将文件命名为任意名称.现在将其添加到字典中,通过运行以下命令将custom.rws文件移动到字典位置/ usr/lib/aspell:
cp custom.rws /usr/lib/aspell/要完成将其添加到字典,请通过运行以下命令将其更改为字典目录:
Run Code Online (Sandbox Code Playgroud)cd /usr/lib/aspell/ then edit the following file: nano en_US.multi并添加以下行:
add custom.rws
这些方法似乎都不起作用,我找不到任何关于如何正确添加字典或单词列表的明确示例.这是我能找到的两种最有前途的方法,但都没有效果.有谁知道我怎么能让Aspell使用我创建的个人字典文件?
感谢您的时间.
编辑:这里概述的步骤对我有用.它们与此处列出的非常相似,除了后者指的是"en_US.multi",前者指的是"en.multi".将自定义列表添加到en.multi(而不是en_US.multi)后,它按预期工作.
Aspell将带有下划线或短划线的单词视为两个,例如,基于云的拼写检查为"云"和"基于".有没有办法指定单词分隔符以排除短划线和下划线?
当我aspell(用英国词典)检查我的文本时,接受" froward " 这个词(因为它是一个真正的英语单词).但是我从不使用它,所以在我的文本中," froward "总是错误的" 向前 ".因此,我想aspell拒绝" fr "".
如何从Aspell的标准字典中删除单词?有没有办法创建单词的"黑名单"?没有办法将其标记 .aspell.en.pws,因为个人字典只包含"白名单".
我有大量来自19世纪的英文OCRed文档,并希望通过使用上下文拼写检查来清理一些OCR错误,例如Peter Norvig在http://norvig.com/spell-correct提出的算法..html.我的主要目标是能够使用概率模型(连同ocred文本数据和适当的大词典)来纠正错误拼写的单词.
我很高兴使用Norvig在他的网站上提供的代码并对其进行改进,但在此之前,我想问一下是否有一个开源解决方案.Norivg本人建议看看aspell,但我不认为aspell是一个上下文拼写检查器,我担心它可能在OCR纠错方面效果不好.
我正在尝试在 AWS 上的 Lambda 函数中使用 Python 拼写检查库 Pyenchant。Pyenchant 是 C libenchant 库的包装器,而该库又依赖于来自 Aspell 等提供商的单词词典。
在 Lambda 上运行的 python 代码中,我能够成功导入已编译的 enchant 库以及 AWS Linux EC2 实例上的 C 库 (libenchant.so),并将输出复制到我的 Lambda 部署包。
然而,当 pyenchant 库在 Lambda 上运行时,它无法加载任何需要工作的单词词典。然后我使用以下命令在 EC2 实例上安装了 Aspell:
yum install aspell-en enchant-aspell
Run Code Online (Sandbox Code Playgroud)
然后,我将以下附加 .so 文件复制到部署包的 /lib 文件夹中:
我很确定 libenchant_aspell.so 是实际的字典,但它没有拾取它,我不知道下一步该去哪里。
下面是我的 lambda_handler python 代码:
from __future__ import print_function
import os
import sys
import re
import enchant
enchant.set_param("enchant.aspell.dictionary.path","/var/task/lib")
def lambda_handler(event, context):
print("# List available enchant dictionary …Run Code Online (Sandbox Code Playgroud) aspell ×10
gnu ×2
ispell ×2
php ×2
automation ×1
aws-lambda ×1
bash ×1
camelcasing ×1
emacs ×1
enchant ×1
ocr ×1
open-source ×1
pspell ×1
pyenchant ×1
python ×1
windows ×1