日语的Unicode范围

Nee*_*mar 22 unicode

我想分开英文和日文字符.我需要找到所有日文字符的Unicode范围.什么是所有日文字符的Unicode范围?

Sea*_*mbo 38

正如zawhtut所提到的,这个页面有几个unicode范围的参考.总结范围:

  • 日式标点符号(3000 - 303f)
  • 平假名(3040 - 309f)
  • 片假名(30a0 - 30ff)
  • 全角罗马字符和半角片假名(ff00 - ffef)
  • CJK统一表意文字 - 普通和不常见的汉字(4e00 - 9faf)

  • 这是一个很好的概述,但必须小心平假名范围。U+3040、U+3097 和 U+3098 实际上不是平假名字符。 (2认同)

jam*_*625 8

尽管这个问题已经有了答案,但是此博客文章可能更完整。

请访问该网站并获取其指标,但是为了后代,请复制粘贴。

平假名

Unicode代码点正则表达式: [\x3041-\x3096]

Unicode块属性正则表达式: \p{Hiragana}

?????????????????????????????????????????????????????????????????????????????????????????????

片假名(全角)

Unicode代码点正则表达式: [\x30A0-\x30FF]

Unicode块属性正则表达式: \p{Katakana}

????????????????????????????????????????????????????????????????????????????????????????????????

汉子

Unicode代码点正则表达式: [\x3400-\x4DB5\x4E00-\x9FCB\xF900-\xFA6A]

Unicode块属性正则表达式: \p{Han}

?? ??? ?? ?? ?? 等等。要列出的字符过多。

该正则表达式将匹配所有汉字,包括中文。

汉字部首

Unicode代码点正则表达式: [\x2E80-\x2FD5]

??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

片假名和标点符号(半角)

Unicode代码点正则表达式: [\xFF5F-\xFF9F]

????????????????????????????????????????????????????????????????

日语符号和标点

Unicode代码点正则表达式: [\x3000-\x303F]

???????????????????????????????????????????????????????????????

其他日语符号和字符

Unicode代码点正则表达式: [\x31F0-\x31FF\x3220-\x3243\x3280-\x337F]

???????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????

字母数字和标点符号(全角)

Unicode代码点正则表达式: [\xFF01-\xFF5E]

??????????????????????????????????????????????????????????????????????????????????????????????


小智 6

CJK(中文日文和韩文),平假名和片假名(包括Halfwidth Katakana)

http://www.unicode.org/charts/

  • 答案应该是自包含的.链接应该是背景,背景材料和来源.请参阅[此处](https://stackoverflow.com/help/how-to-answer):"如果目标站点无法访问或永久脱机,请始终引用重要链接的最相关部分." (3认同)

zaw*_*tut 5

请参阅此页面以供参考.它包含片假名,平假名和汉字unicode系列.

  • 答案应自成体系。链接应针对上下文,背景材料和来源。请参阅[here](https://stackoverflow.com/help/how-to-answer):“始终引用重要链接中最相关的部分,以防目标站点无法访问或永久脱机。” (2认同)