日语字符的正则表达式

Nil*_*kla 8 javascript regex unicode internationalization cjk

我在Struts做国际化.我想为日语和英语用户编写Javascript验证.我知道英语的正则表达式,但不是日本用户.是否可以为基于Unicode验证的用户编写一个正则表达式?

请帮我.

sha*_*eck 22

这个帖子可能很旧但只是认为我加了2美分.这是一个正则表达式,可用于匹配所有英语字母数字,日本片假名,平假名,字母数字[hankaku和zenkaku]的多字节,破折号

/[?-?]+|[?-?]+|[?-??]+|[a-zA-Z0-9]+|[?-??-??-?]+[???]+/u
Run Code Online (Sandbox Code Playgroud)

您可以编辑它以满足您的需要,但最后注意"u"标志.

我希望这有帮助!

  • 就在今天发现了更多未包含的字符!`々〆〤`,分别为 unicode 3005、3006 和 3024。3005可能是最重要的,因为它用在代々木和时々这样的词中 (2认同)
  • @shawndreck 非常简单.. 我需要允许汉字字符。那么我如何修改上面建议的表达式以允许汉字字符? (2认同)
  • 我使用这个正则表达式(基于 shawndreck 的答案)仅将日语字符列入白名单,效果很好:`[一-龠ぁ-ゔァ-ヴーa-zA-Z0-9々〆〤]+` (2认同)

spr*_*aff -1

如果您的文本编辑器和编程语言支持 Unicode,您应该能够输入日语字符作为文字字符串。[A-X]一般来说,范围之类的东西可能不会很好地翻译。

您要验证什么类型的文本?

常规表达用什么语言?Perl 兼容、POSIX 还是其他?