Solr vs 文档编码问题

use*_*084 5 java solr character-encoding

我正在使用 solrj 1.4。我的 solrj 没有正确索引 utf-16 编码的文档。我猜当它尝试转换为 unicode 时,它​​会用 unicode 可替换字符 U+FFFD 替换有问题的 utf-16 代理键。谁能指导我如何配置 solrj 1.4 以索引/搜索 utf-16 文档以及 utf-8 ?

Joh*_*erg 2

Solr 索引采用 utf-8 格式(为什么国际字符不起作用)。为了能够使用其他编码进行搜索,您始终可以在与 Solr 接口的软件中执行翻译。