日语字符的正则表达式

Question

我在Struts做国际化.我想为日语和英语用户编写Javascript验证.我知道英语的正则表达式,但不是日本用户.是否可以为基于Unicode验证的用户编写一个正则表达式？

请帮我.

Answer 1

这个帖子可能很旧但只是认为我加了2美分.这是一个正则表达式,可用于匹配所有英语字母数字,日本片假名,平假名,字母数字[hankaku和zenkaku]的多字节,破折号

/[?-?]+|[?-?]+|[?-??]+|[a-zA-Z0-9]+|[?-??-??-?]+[???]+/u

您可以编辑它以满足您的需要,但最后注意"u"标志.

我希望这有帮助!

就在今天发现了更多未包含的字符！`々〆〤`，分别为 unicode 3005、3006 和 3024。3005可能是最重要的，因为它用在代々木和时々这样的词中 (2认同)
@shawndreck 非常简单.. 我需要允许汉字字符。那么我如何修改上面建议的表达式以允许汉字字符？ (2认同)
我使用这个正则表达式（基于 shawndreck 的答案）仅将日语字符列入白名单，效果很好：`[一-龠ぁ-ゔァ-ヴーa-ｚＡ-Ｚ0-9々〆〤]+` (2认同)

Answer 2

如果您的文本编辑器和编程语言支持 Unicode，您应该能够输入日语字符作为文字字符串。[A-X]一般来说，范围之类的东西可能不会很好地翻译。

您要验证什么类型的文本？

常规表达用什么语言？Perl 兼容、POSIX 还是其他？