我正在尝试收集所有破折号以在分析原始文本数据时使用它。我发现Unicode正则表达式\\p{Pd}应该匹配所有大小写,但毕竟,结果证明这个字符\xe2\x88\x92不匹配!
\\p{Pd}
\xe2\x88\x92
以下是有关此字符的更多信息:\n https://www.fileformat.info/info/unicode/char/2212/index.htm
这是一个错误还是一个功能?实际上这并不是什么有用的东西。
regex unicode
regex ×1
unicode ×1