尽管这个问题已经有了答案,但是此博客文章可能更完整。
请访问该网站并获取其指标,但是为了后代,请复制粘贴。
平假名
Unicode代码点正则表达式:
[\x3041-\x3096]Unicode块属性正则表达式:
\p{Hiragana}?????????????????????????????????????????????????????????????????????????????????????????????
片假名(全角)
Unicode代码点正则表达式:
[\x30A0-\x30FF]Unicode块属性正则表达式:
\p{Katakana}????????????????????????????????????????????????????????????????????????????????????????????????
汉子
Unicode代码点正则表达式:
[\x3400-\x4DB5\x4E00-\x9FCB\xF900-\xFA6A]Unicode块属性正则表达式:
\p{Han}?? ??? ?? ?? ?? 等等。要列出的字符过多。
该正则表达式将匹配所有汉字,包括中文。
汉字部首
Unicode代码点正则表达式:
[\x2E80-\x2FD5]??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????
片假名和标点符号(半角)
Unicode代码点正则表达式:
[\xFF5F-\xFF9F]????????????????????????????????????????????????????????????????
日语符号和标点
Unicode代码点正则表达式:
[\x3000-\x303F]???????????????????????????????????????????????????????????????
其他日语符号和字符
Unicode代码点正则表达式:
[\x31F0-\x31FF\x3220-\x3243\x3280-\x337F]???????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????
字母数字和标点符号(全角)
Unicode代码点正则表达式:
[\xFF01-\xFF5E]??????????????????????????????????????????????????????????????????????????????????????????????
小智 6
CJK(中文日文和韩文),平假名和片假名(包括Halfwidth Katakana)
http://www.unicode.org/charts/