在正则表达式中是否有任何方法可以为具有特定变音符号的字符指定匹配?让我们说一个重要的口音.要做到这一点,最重要的是转到严重重音的维基百科页面,复制它显示的所有字符,然后从中制作一个字符类:
/[à??è??ì?ò??ù????]/i
Run Code Online (Sandbox Code Playgroud)
这很乏味.我希望像\p{hasGraveAccent}我这样的Unicode属性,但我找不到那样的东西.搜索解决方案只会出现人们试图匹配字符而忽略变音符号的问题,这涉及执行某种规范化,这不是我想要的.
我正在尝试在 html5 画布上沿曲线绘制文本。为此,我需要将输入文本分解为可以单独旋转和翻译等的组成字符。对于英语来说,文本的分解很容易。给定输入字符串s,s[i]给出第 i 个字符。但这对于非英语字符串不起作用。我这里有一个 jsfiddle 说明了问题: http: //jsfiddle.net/c6HV8/。请注意,在撰写本文时,fiddle 在 Chrome 和 IE 中的显示方式有所不同。要了解问题所在,请考虑 string 中有非英文文本s。创建一个要传递到的文本节点s。接下来,为每个节点创建一个文本节点s[i]并显示彼此相邻的文本节点。现在比较结果。他们不一样。如何将非英文文本分解为javascript中的组成字符,以便两个结果相同?

如果你在python(2.x)中循环使用unicode字符串,请说:
ak.sɛp.tɑ
你怎么知道当前的char是否是一个组合变音符号?
例如,上面字符串中的最后一个字符实际上是一个组合标记:
ak.sɛp.tɑ - >
我正在寻找一种方法来检测java字符串中的字符是否是"组合字符".例如,
String khmerCombiningVowel =
new String(new byte[]{(byte) 0xe1,(byte) 0x9f,(byte) 0x80}, "UTF-8"); // unicode 17c0
Run Code Online (Sandbox Code Playgroud)
代表结合高棉元音符号.我尝试过"\\p{InCombiningDiacriticalMarks}" 正则表达式,但它似乎不适用于这些特殊的组合字符.或者即使有一些所有unicode组合字符块的综合列表,我也可以为它们制作一个正则表达式?