bil*_*l_e 7 regex glibc utf-8 libc multibyte-functions
有没有得到正则libc6表达式函数regcomp并regexec使用多字节字符正常工作?
例如,如果我的模式是utf8字符??+?,则在utf8编码的字符串上找到匹配?????将失败,它应该成功.
我认为这是因为字符?的字节表示是\xe6\x9c\xba,并且+匹配一个或多个字节\xba.我可以通过在模式中的每个多字节字符周围加括号来使这个实例工作,但由于这是一个应用程序,我不能要求用户这样做.
有没有办法标记一个模式或字符串匹配为包含utf8字符?也许告诉libc将模式存储为wchar而不是char?