joh*_*yes 5 formatting dictionary aspell sublimetext2 affix
我目前正在研究在我正在构建的应用程序中使用的最合适的字典.
检查与Sublime Text 2捆绑在一起的字典,文件格式与您期望的一样 - 按字母顺序排列的单词列表.但是,很多这些词都附加了额外的信息.以此片段为例:
abaft
abbreviation/M
abdicate/DNGSn
Abelard/M
abider/M
Abidjan
ablaze
abloom
aboveground
abrader/M
Abram/M
abreaction/MS
abrogator/MS
abscond/DRSG
absinthe/MS
absoluteness/S
absorbency/SM
abstract/ShTVDPiGY
absurdness/S
Run Code Online (Sandbox Code Playgroud)
一个毫无结果的谷歌搜索没有说明斜杠(/)之后的字母是什么意思.
也许他们暗示了这个词的性别,但这只是一个猜测,我更愿意阅读他们意义的正式解释.
有人遇到过这些吗?
TLDR:.dic文件中斜杠后面的每个字母都是文件中规则的名称.aff。
https://superuser.com/a/633869/367530
每个规则都在该语言的 .aff 文件中。这些规则有两种形式:后缀的 SFX 和前缀的 PFX。每一行都以 PFX/SFX 开头,然后是规则字母标识符(字典文件中单词后面的那些:
PFX [rule_letter_identifier] [combineable_flag] [number_of_rule_lines_that_follow]您通常可以忽略可组合标志,它是 Y 或 N 取决于它是否可以与其他规则组合。然后有一些行(由 表示)列出了此规则在不同情况下如何应用的不同可能性。它看起来像这样:
PFX [rule_letter_identifier] [number_of_letters_to_delete] [what_to_add] [when_to_add_it]例如:
SFX B Y 3SFX B 0 able [^aeiou]SFX B 0 able eeSFX B e able [^aeiou]e如果
B是单词后面的字母之一,即someword/B,那么这是可以应用的规则之一。可能发生三种可能性(因为有三行)。只有一种适用:
able被添加到结束时的单词的末尾是不(通过指示^)在该组中的字母中的一个(通过标明[ ]的字母)a,e,i,o,和u。例如,问题?可疑的- 当单词的结尾是 时,将能够添加到结尾
ee。例如,同意?合适的。- 当词尾不是元音 (
[^aeiou]) 后跟 an时,将able 添加到词尾e。字母e被剥离(能够之前的列)。例如,激发 ? 兴奋。PFX 规则是相同的,但应用于单词的开头而不是前缀。
| 归档时间: |
|
| 查看次数: |
1988 次 |
| 最近记录: |