将 Chrome (hunspell) 中的两个 BDIC 文件合二为一

osg*_*sgx 4 dictionary google-chrome hunspell

我有两个来自 Google Chrome 拼写检查器(基于 hunspell)的 BDIC(二进制字典?)文件。我想将这两个文件合并为所有单词的一个 BDIC。

这是来自 Chrome 源 (LGPL/C++) 的这种格式的读取器/写入器(chromium/src/third_party/hunspell/google/bdict_reader.h)

如何使用 C++ 或命令行实用程序组合两个文件?

Hon*_*a R 6

合并两个 hunspell 词典很容易,有像https://github.com/arty-name/hunspell-merge这样的工具可以帮助您将任意数量的源词典合并在一起。

创建bdictChrome 理解的文件比较棘手。Chrome使用这种格式的优化,并使用convert_dict工具在内部转换affdic文件bdict。我在网上找不到这个工具,所以它只剩下一个选项,从 Chromium 源构建它。Google 有一个非常直接的设置,如果仔细执行,您将可以构建此工具。首先,您必须按照http://dev.chromium.org/developers/how-tos/get-the-code获取代码并根据您的平台设置环境。之后执行ninja -C out\Debug convert_dict,如果完成没有错误,convert_dictout/Debug文件夹下找到你的可执行文件。

您无法向 Chrome 添加自定义语言(据我所知),因此您必须替换预定义的语言之一。我建议安装一种您不理解的语言并将其用于合并的语言。这些bdict文件可以在 Chrome 用户配置文件文件夹中找到。