我正在寻找适合我的用例的语言翻译 API/解决方案。
我的用例如下:
- 数据是 1 GB 的免费非结构化文本,主要使用世界通用语言(法语、西班牙语、德语、俄语、韩语)编写。每段文本的语言都是已知的。
- 我们可以假设文本在语法上是正确的,由完整的句子组成,但包含一些不常见的单词,例如化合物名称。
- 文本必须被翻译成英文。
- 该解决方案必须至少比谷歌翻译便宜 10 倍,谷歌翻译每 100 万个字符收费 20 美元。
- 我愿意用谷歌的一些质量来换取成本效益。谷歌、雅虎、微软、Yandex、Online-Translator.com 都足够好,只是太贵了。
我有一台 16 CPU 的机器可供我使用,所以离线翻译也是一种选择。
有什么建议?