.dic行格式定义

joh*_*yes 5 formatting dictionary aspell sublimetext2 affix

我目前正在研究在我正在构建的应用程序中使用的最合适的字典.

检查与Sublime Text 2捆绑在一起的字典,文件格式与您期望的一样 - 按字母顺序排列的单词列表.但是,很多这些词都附加了额外的信息.以此片段为例:

abaft
abbreviation/M
abdicate/DNGSn
Abelard/M
abider/M
Abidjan
ablaze
abloom
aboveground
abrader/M
Abram/M
abreaction/MS
abrogator/MS
abscond/DRSG
absinthe/MS
absoluteness/S
absorbency/SM
abstract/ShTVDPiGY
absurdness/S
Run Code Online (Sandbox Code Playgroud)

一个毫无结果的谷歌搜索没有说明斜杠(/)之后的字母是什么意思.

也许他们暗示了这个词的性别,但这只是一个猜测,我更愿意阅读他们意义的正式解释.

有人遇到过这些吗?

AGS*_*AGS 5

斜杠后面的字母称为后缀。这些编码可以是可以应用于根词的前缀或后缀。

请参阅此博客文章,以获取很好的解释以及这些词缀可用于的示例。

另一个地方aspell手册。


PJS*_*and 5

TLDR.dic文件中斜杠后面的每个字母都是文件中规则的名称.aff

https://superuser.com/a/633869/367530

每个规则都在该语言的 .aff 文件中。这些规则有两种形式:后缀的 SFX 和前缀的 PFX。每一行都以 PFX/SFX 开头,然后是规则字母标识符(字典文件中单词后面的那些:

PFX [rule_letter_identifier] [combineable_flag] [number_of_rule_lines_that_follow]

您通常可以忽略可组合标志,它是 Y 或 N 取决于它是否可以与其他规则组合。然后有一些行(由 表示)列出了此规则在不同情况下如何应用的不同可能性。它看起来像这样:

PFX [rule_letter_identifier] [number_of_letters_to_delete] [what_to_add] [when_to_add_it]

例如:

  • SFX B Y 3
  • SFX B 0 able [^aeiou]
  • SFX B 0 able ee
  • SFX B e able [^aeiou]e

如果B是单词后面的字母之一,即someword/B,那么这是可以应用的规则之一。可能发生三种可能性(因为有三行)。只有一种适用:

  • able被添加到结束时的单词的末尾是(通过指示^)在该组中的字母中的一个(通过标明[ ]的字母)aeio,和u。例如,问题?可疑的
  • 当单词的结尾是 时,将能够添加到结尾ee。例如,同意?合适的。
  • 当词尾不是元音 ( [^aeiou]) 后跟 an时,将able 添加到词尾e。字母e被剥离(能够之前的列)。例如,激发 ? 兴奋。

PFX 规则是相同的,但应用于单词的开头而不是前缀。