将 1GB 的文本翻译成英文

Ale*_*kov 4 google-translate machine-translation language-translation

我正在寻找适合我的用例的语言翻译 A​​PI/解决方案。

我的用例如下:

  • 数据是 1 GB 的免费非结构化文本,主要使用世界通用语言(法语、西班牙语、德语、俄语、韩语)编写。每段文本的语言都是已知的。
  • 我们可以假设文本在语法上是正确的,由完整的句子组成,但包含一些不常见的单词,例如化合物名称。
  • 文本必须被翻译成英文。
  • 该解决方案必须至少比谷歌翻译便宜 10 倍,谷歌翻译每 100 万个字符收费 20 美元。
  • 我愿意用谷歌的一些质量来换取成本效益。谷歌、雅虎、微软、Yandex、Online-Translator.com 都足够好,只是太贵了。

我有一台 16 CPU 的机器可供我使用,所以离线翻译也是一种选择。

有什么建议?

sav*_*kov 5

对于您的翻译量,机器翻译的价格从每 100 万个符号 3 美元到 25 美元不等(有些异常值,例如 ModernMT,每 1000 个字的成本为 eu)。

MT 价格比较

如果您想牺牲一点质量,您可以选择我们所说的“最佳引擎”——性能在前 5% 以内但价格最低的引擎。

最佳通用 MT 引擎

您可以在我们 2018 年 7 月的机器翻译报告中找到更多详细信息。

然后,您需要知道哪些引擎支持您的语言对并处理它们的 API、请求限制和配额。

您可以使用Intento API 来获取您的语言对的引擎列表。然后,您可以在异步模式下使用此 API ,然后 Intento 会处理所有限制。不过我不确定它是否会处理 1G 文件,但欢迎您尝试。

为了避免修改 API 请求,我建议使用CLI