我读过并听说C++ 11支持Unicode.关于这一点的一些问题:
std::string做自己应该?如果我想使用带有unicode字符串的C++ 11正则表达式,它们是否可以作为UTF-8使用char*,还是必须将它们转换为wchar_t*字符串?
我想在UTF-32代码点上使用正则表达式,并发现此引用声明std :: regex_traits必须由用户定义,以便可以使用std :: basic_regex.未来似乎没有计划改变.
为什么会这样呢?
这是否与Unicode说组合代码点必须被视为等于单代码点表示(如变形'ä'表示为单个代码点或a和圆点为两个独立的代码点)这一事实有什么关系?
鉴于只支持单码点字符的简化,这种特性是否可以很容易地定义,或者这可能是非平凡的还是需要进一步的限制?