需要:开源C/C++正则表达式库,用于执行unicode

vy3*_*y32 7 c unicode pcre flex-lexer

我正在寻找一个良好的开源C/C++正则表达式库,它具有完整的Unicode支持.

我在库可能获得ASCII,UTF-8或UTF-16的环境中使用它.如果它获得UTF-16,它可能有也可能没有必要的引用字符(FF FE)或(FE FF).

我环顾四周,除了PCRE之外似乎没有其他选择.

我的第二个问题是我目前正在使用flex来构建一些巨大的正则表达式.理想情况下,我会有一个类似flex的词法表达式生成器,它也可以处理Unicode.

有什么建议?

Joh*_*don 9

你考虑过ICU吗?

它具有成熟的正则表达支持.