用于设置MIME类型的xgettext,msginit,msgfmt序列的命令或选项?

CW *_* II 5 linux gettext internationalization

通过手动编辑模板文件中的MIME Con​​tent-Type字符集来纠正波兰文本上的msgfmt"无效多字节序列"错误.是否有一些用于设置MIME类型的xgettext,msginit,msgfmt序列的命令或选项?

cat >plt.cxx <<EOF
// plt.cxx
#include <libintl.h>
#include <locale.h>
#include <iostream>
int main (){
    setlocale(LC_ALL, "");
    bindtextdomain("plt", ".");
    textdomain( "plt");
    std::cout << gettext("Invalid input. Enter a string at least 20 characters long.") << std::endl;
}
EOF
g++ -o plt plt.cxx
xgettext --package-name plt --package-version 1.2 --default-domain plt --output plt.pot plt.cxx
sed --in-place plt.pot --expression='s/CHARSET/UTF-8/'
msginit --no-translator --locale pl_PL --output-file plt_polish.po --input plt.pot
sed --in-place plt_polish.po --expression='/#: /,$ s/""/"Nieprawid?owo wprowadzone dane. Wprowad? ci?g przynajmniej 20 znaków."/'
mkdir --parents ./pl_PL.utf8/LC_MESSAGES
msgfmt --check --verbose --output-file ./pl_PL.utf8/LC_MESSAGES/plt.mo plt_polish.po
LANGUAGE=pl_PL.utf8 ./plt
Run Code Online (Sandbox Code Playgroud)

小智 9

只需提供完整的语言环境名称,msginit将正确设置charset

msginit --no-translator --input=xx.pot --locale=ru_RU.UTF-8
Run Code Online (Sandbox Code Playgroud)

结果是

"Language: ru\n"
"Content-Type: text/plain; charset=UTF-8\n"
Run Code Online (Sandbox Code Playgroud)


Kar*_*mer 7

有一个设置直接编码输出字符没有说法,但这应该在初步实践不是一个问题,因为保存PO文件时,你的PO编辑器将自动使用相应的字符编码(一个支持在转换中使用的所有字符) ,并CHARSET在文件中替换编码的名称.如果没有,请提交错误.

唯一的问题是如果POT文件包含非ASCII字符,但xgettext 确实有一个--from-code参数,它指定输入文件的编码.如果输入包含非ASCII字符并--from-code设置为正确的编码,则输出POT文件将字符编码设置为UTF-8(这不必等于输入字符编码).但是,如果输入文件只包含ASCII字符,--from-code=UTF-8则遗憾的是无效.

msginit事实上,自动将字符编码设置为所选目标语言环境的"适当".但是,字符串编码对的区域设置列表似乎已过时; UTF-8现在是所有语言的最佳选择.

另一种方法是使用pot2po而不是msginit.这总是自动使用UTF-8,AFAICS.但是,msginit与之不同的是,它不会自动填写PO文件的复数形式,这可能是也可能不是问题(有些人认为这是PO编辑器的工作).