用于单元测试的Unicode测试字符串

Chr*_*cke 12 c++ unicode unit-testing

我需要一些Utf32测试字符串来练习一些跨平台的字符串操作代码.我想要一套测试字符串来运行utf32 < - > utf16 < - > utf8编码,以验证BMP之外的字符可以从utf32转换为utf16代理,通过utf8,然后返回.正常.

如果所讨论的字符串不仅仅是由随机字节组成,而且在它们编码的(各种)语言中实际上有意义,我总会觉得它更优雅一些.

tia*_*mex 14

虽然这不是你要求的,但我总是发现这个测试文档很有用.

http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-test.txt

同一网站提供此功能

http://www.cl.cam.ac.uk/~mgk25/ucs/examples/quickbrown.txt

...这是英语的"快速棕狐"文本的等价物,它使用各种语言来运用所有使用的字符.这个页面指的是更大的"pangrams"列表,它曾经在维基百科上,但显然在那里删除了.它仍然可以在这里:

http://clagnut.com/blog/2380/