任何人都可以在 Linux 中推荐一个好的“词典”软件。我有 artha,但我实际上期待一个更好的。
好的,这是我在字典中查找的内容:
好数据库
单词发音(这在 Artha 中不可用。)
/usr/share/dict/words
包含很多单词。这个列表是如何生成的?它的内容在不同的 Unices 中是否相同?是否有任何标准规定它必须包含什么?
到目前为止,我所能找到的是,在 Ubuntu/Debian 上,列表来自wordlist包,但它们的描述没有提供关于列表是如何实际生成的线索。
我正在寻找一个 Linux (Ubuntu) 软件,它可以让我记下我在线学习的新单词。
我手动添加新单词、它们的含义和用法。然后,该软件以漂亮的格式显示每个项目,并允许我以多种方式查看它们,例如,随机或仅按字母顺序。
能够将列表导出到文件中,以便在其他软件中使用也很好。
它有点像一盒词汇卡,但希望有一些额外的有用功能。
如何通过linux命令行查找并打印文件中包含的英文单词?
目前,我正在编写一个关于数学的大型 LaTeX 文档,偶尔我会对其进行一些拼写检查。您可以猜到,有很多单词不在标准词典中。但我已经添加了他们aspell
与a在标准字典。
aspell -d de -t -c my-document.tex
Run Code Online (Sandbox Code Playgroud)
有没有办法导出我的话(只有那些)?
恢复似乎很简单:另一个问题。
我有一个包含两种语言的大型 .tex 文件,我想在不发疯的情况下对其进行拼写检查。因此,仅对一种语言进行拼写检查并针对另一种语言的单词按“忽略”是不可行的。
所以我读了 aspell 并发现你可以定义你自己的.multi
文件来组合字典。但显然你不能对不同语言的字典执行此操作,它会抛出错误(或者,如果你使用 GUI 工作,字典将显示为空)。
另外,我发现了一份错误报告,将此功能列入愿望清单,但似乎还没有人实现它。
所以,我的问题是:是否有任何明智的方法可以同时使用两种不同语言的两个词典?
这个问题让我很头疼,而且互联网上几乎没有关于如何做到这一点的文档。因此,我将把我找到的解决方法作为答案,以节省其他人(包括未来的我)的麻烦。但如果您有更好的解决方案,请发布。
我看到我们在 debian 中有 freeict-all。
$ sudo aptitude install dict-freedict-all
[sudo] password for shirish:
The following NEW packages will be installed:
dict-freedict-afr-deu{a} dict-freedict-afr-eng{a} dict-freedict-all
dict-freedict-ara-eng{a} dict-freedict-bre-fra{a} dict-freedict-ces-eng{a}
dict-freedict-ckb-kmr{a} dict-freedict-cym-eng{a} dict-freedict-dan-eng{a}dict-freedict-deu-eng{a} dict-freedict-deu-fra{a} dict-freedict-deu-ita{a} dict-freedict-deu-kur{a} dict-freedict-deu-nld{a} dict-freedict-deu-por{a} dict-freedict-deu-swe{a} dict-freedict-deu-tur{a} dict-freedict-eng-afr{a} dict-freedict-eng-ara{a} dict-freedict-eng-ces{a} dict-freedict-eng-cym{a} dict-freedict-eng-deu{a} dict-freedict-eng-ell{a} dict-freedict-eng-fra{a} dict-freedict-eng-gle{a} dict-freedict-eng-hin{a} dict-freedict-eng-hrv{a} dict-freedict-eng-hun{a} dict-freedict-eng-ita{a} dict-freedict-eng-lat{a} dict-freedict-eng-lit{a} dict-freedict-eng-nld{a} dict-freedict-eng-pol{a} dict-freedict-eng-por{a} dict-freedict-eng-rom{a} dict-freedict-eng-rus{a} dict-freedict-eng-spa{a} dict-freedict-eng-srp{a} dict-freedict-eng-swe{a} dict-freedict-eng-swh{a} dict-freedict-eng-tur{a} dict-freedict-fra-bre{a} dict-freedict-fra-deu{a} dict-freedict-fra-eng{a} dict-freedict-fra-nld{a} dict-freedict-gla-deu{a} dict-freedict-gle-eng{a} dict-freedict-gle-pol{a} dict-freedict-hrv-eng{a} dict-freedict-hun-eng{a} dict-freedict-isl-eng{a} dict-freedict-ita-deu{a} dict-freedict-ita-eng{a} dict-freedict-jpn-deu{a} dict-freedict-jpn-eng{a} dict-freedict-jpn-fra{a} dict-freedict-jpn-rus{a} dict-freedict-kha-deu{a} dict-freedict-kha-eng{a} dict-freedict-kur-deu{a} dict-freedict-kur-eng{a} …
Run Code Online (Sandbox Code Playgroud) 维基百科说它是愿望清单 Wordlist 或 Words 包的一部分
在 Debian 和 Ubuntu 上,words 文件由 wordlist 包提供,或其提供程序包 wbritish、wamerican 等。在 Fedora 和 Arch 上,words 文件由 words 包提供。
但是这是从哪里编译的?我一直在用它来“帮助”解决工作中的填字游戏,但它遗漏了很多单词,还有很多我不认识的单词。
这个文件的来源是什么?
我尝试转换的 .dsl 格式的字典文件有一些特殊之处。它本质上是一个带有字典对的文本文件。我使用的词典软件是GoldenDict。它需要 UTF-16 字典才能正确呈现。
\n我拥有的所有词典都是 UTF-16LE 格式。然而,有一个很突出。它具有 iso-8859-1 编码。当我用 vim 打开条目时,它看起来像这样:
\nabandonarse\n [m2][c crimson][b]Sin\xc3\xb3nimos[/b][/c][/m]\n [m2][i][c green]verbo[/c][/i][/m]\n [m1][trn][b]desanimarse:[/b] <<desanimarse>>, <<abatirse>>, <<tumbarse>>, <<plegarse>>, <<entregarse>>, <<desligarse>>[/trn][/m]\n
Run Code Online (Sandbox Code Playgroud)\n我必须将其转换为 UTF-16LE,因为 Goldendict 呈现一些西里尔字符而不是西班牙重音字符。\n然后我尝试:
\niconv -f iso-8859-1 -t utf-16le dictionary.dsl -o test.dsl\n
Run Code Online (Sandbox Code Playgroud)\n新的 test.dsl 字典由 Goldendict 正确呈现,但是我可以看到一些我想摆脱的奇怪的东西。首先,刚刚转换的文件的编码无法被识别,因为它通常与其他字典一样:
\n aleksandr@desktop:~/windoc/Dic/Es extra/dictionary.dsl> file dictionary.dsl\ndictionary: data\n
Run Code Online (Sandbox Code Playgroud)\n当我用 vim 打开文件 test.dsl 时,里面的每个字符都添加了 ^@ 。以下是同一条目的示例:
\n ^@<^@<^@e^@n^@t^@r^@e^@g^@a^@r^@s^@e^@>^@>^@,^@ ^@<^@<^@d^@e^@s^@l^@i^@g^@a^@r^@s^@e^@>^@>^@[^@/^@t^@r^@n^@]^@[^@/^@m^@]^@\n^@ ^@[^@m^@2^@]^@[^@c^@ ^@c^@r^@i^@m^@s^@o^@n^@]^@[^@b^@]^@A^@n^@t^@\xc3\xb3^@n^@i^@m^@o^@s^@[^@/^@b^@]^@[^@/^@c^@]^@[^@/^@m^@]^@\n^@ ^@[^@m^@2^@]^@[^@i^@]^@[^@c^@ ^@g^@r^@e^@e^@n^@]^@v^@e^@r^@b^@o^@[^@/^@c^@]^@[^@/^@i^@]^@[^@/^@m^@]^@\n
Run Code Online (Sandbox Code Playgroud)\n我尝试在 vim 中删除这个字符
\n%s/<Ctrl-V><Ctrl-J>//g\n
Run Code Online (Sandbox Code Playgroud)\n但是,然后我保存文件,它的编码再次为 iso-8859-1。\n我希望显示的文件不带 ^@ 字符,因为我可能需要手动编辑字典中的一些标题。
\n我正在我的 Ubuntu 系统上寻找威尔士语单词列表。apt-file search /usr/share/dict/
不显示选项。但是aspell-cy确实存在。官方描述是“这个包包含了为 GNU Aspell 拼写检查器添加对威尔士语言的支持所需的所有文件。” 我已经安装了它,但找不到它应该使用的单词列表。
我在哪里可以找到威尔士语单词表?