可aspell输出线号,而不是在管模式抵消了HTML和XML文件?我无法逐行读取文件,因为在这种情况下aspell无法识别封闭标记(如果标记位于下一行).
我目前正在开展一个项目,我认为能够用各种语言提出单词的语音表示非常有用.我知道Aspell做得很好,但是我认为没有一种非常简单的方式可以获得他们的语音表示,所以我问:是否还有其他一些好的方法可以获得单词和语言的单词的语音表示/方言/口音/它来自何处?
这不需要使用任何特定的语言,但如果它是Perl,那将是最好的.
我已经尝试过Soundex,Metaphone,DoubleMetaphone以及Text :: Phonetic中的所有其他内容,而且这些东西都不是很好 - 绝对不如Aspell的那么好.
我目前正在研究在我正在构建的应用程序中使用的最合适的字典.
检查与Sublime Text 2捆绑在一起的字典,文件格式与您期望的一样 - 按字母顺序排列的单词列表.但是,很多这些词都附加了额外的信息.以此片段为例:
abaft
abbreviation/M
abdicate/DNGSn
Abelard/M
abider/M
Abidjan
ablaze
abloom
aboveground
abrader/M
Abram/M
abreaction/MS
abrogator/MS
abscond/DRSG
absinthe/MS
absoluteness/S
absorbency/SM
abstract/ShTVDPiGY
absurdness/S
Run Code Online (Sandbox Code Playgroud)
一个毫无结果的谷歌搜索没有说明斜杠(/)之后的字母是什么意思.
也许他们暗示了这个词的性别,但这只是一个猜测,我更愿意阅读他们意义的正式解释.
有人遇到过这些吗?
我在我的应用程序中使用aspell进行拼写检查.我不知道如何在aspell中添加单词.是否可以添加单词
我正在尝试用于aspell检查文本中的拼写。我有一个例外的自定义字典。它们都是 ASCII,但有一个词是 Unicode ( foo.en.pws):
personal_ws-1.1 en 554
Foo
bar
Bárbara
Run Code Online (Sandbox Code Playgroud)
然后,我运行:
cat x.txt | aspell -a --encoding=utf-8 -p ./foo.en.pws
Run Code Online (Sandbox Code Playgroud)
我得到:
Error: ./foo.en.pws: The word "Bárbara" is invalid.
The character '?' (U+A1) may not appear in the middle of a word.
Run Code Online (Sandbox Code Playgroud)
我该怎么办?
我想递归搜索大型代码库(主要是 python、HTML 和 javascript)以查找注释、字符串以及变量/方法/类名称中的拼写错误。对在终端中运行的东西的强烈偏好。
问题是拼写检查器喜欢aspell或scspell几乎只发现误报(例如编程术语,驼峰式术语),而如果它可以帮助我主要找到简单的拼写错误,例如打乱或丢失的字母,例如维护与维护,限制与限制,我会很高兴,部署与部署。
到目前为止我在玩的是:
for f in **/*.py ; do echo $f ; aspell list < $f | uniq -c ; done
Run Code Online (Sandbox Code Playgroud)
但它会找到类似的东西: assertEqual, MyTestCase, lifecycle
我安装了pyenchant(Ubuntu 17.0,Spyder 3.2.4,Python 3.6.1 64bits)使用
pip install pyenchant
Run Code Online (Sandbox Code Playgroud)
当我执行
import enchant
b = enchant.Broker()
print(b.describe())
Run Code Online (Sandbox Code Playgroud)
我正进入(状态
[<Enchant: Hspell Provider>]
Run Code Online (Sandbox Code Playgroud)
我能够发现输出应该至少包含
[<Enchant: Ispell Provider>, <Enchant: Myspell Provider>, <Enchant: Aspell Provider>]
Run Code Online (Sandbox Code Playgroud)
无论出于何种原因,我的 pyenchant 创建了列表中只有一个希伯来语 (hspell) 提供程序的代理。我想使用“us_EN”字典,但可用字典的列表是 [] 如果我没有安装 hspell,或者在我安装 hspell 后是 ['he']。我的系统中确实安装了 aspell,我进行了三重检查。任何帮助将不胜感激。
我正在做bash脚本来检查文件数量的拼写.
我遇到了告诉aspell忽略我允许出现的一些单词的问题.
这与交互模式中的"忽略全部"相同.但这不会起作用,因为我需要手工完成.
我怎么能告诉aspell忽略给定的单词.有没有任何参数可以做到这一点.我希望有一个选项来传递带有这些单词的文件.
或者可能在那里有更有效的方法来编写bash中的拼写检查脚本?
我最近切换到emacs24并升级到Ubuntu 12.04.我似乎无法让hunspell再次正常工作.我发现hunspell一般比aspell好.Hunspell只想使用澳大利亚词典而不是英语美国词典或冻结我的系统.使用aspell,我可以切换字典或运行flyspell模式.
我的问题是人们如何在emacs24中设置交互式拼写?仍然使用ispell和flyspell或任何其他设置首选.你在使用emacs24使用hunspell吗?我可能会继续努力让这个工作,但想确认其他人没有任何问题.
我正在尝试安装aspell-python包进行拼写纠正. 安装包时遇到问题.
错误:
python setup.py install
running install
running build
running build_ext
building 'aspell' extension
gcc -pthread -fno-strict-aliasing -DNDEBUG -g -fwrapv -O2 -Wall -Wstrict-prototypes -fPIC -I/usr/include/python2.7 -c aspell.c -o build/temp.linux-i686-2.7/aspell.o
aspell.c:53:20: fatal error: aspell.h: No such file or directory
compilation terminated.
error: command 'gcc' failed with exit status 1
Run Code Online (Sandbox Code Playgroud)
GCC已经安装了版本gcc(Ubuntu/Linaro 4.7.2-2ubuntu1)4.7.2
libaspell15已经安装
aspell ×10
bash ×2
python ×2
ubuntu ×2
affix ×1
dictionary ×1
elisp ×1
emacs ×1
emacs24 ×1
formatting ×1
html ×1
hunspell ×1
installation ×1
lint ×1
linux ×1
livecode ×1
perl ×1
phonetics ×1
pyenchant ×1
python-3.x ×1
sublimetext2 ×1
translation ×1
xml ×1