正则表达式(类似Twitter)标签,允许非ASCII字符

lim*_*lim 11 javascript regex twitter unicode-string hashtag

我想要一个正则表达式来匹配像twitter中那样的简单主题标签(例如#someword).我希望它也能识别非标准字符(如西班牙语,希伯来语或中文字符).

这是我最初的正则表达式:(^|\s|\b)(#(\w+))\b
- >但它不识别非标准字符.
然后,我尝试使用XRegExp.js,但是运行得太慢了.

有关如何做的任何建议?

lim*_*lim 7

最终我发现了这个:twitter-text.js有用的链接,这基本上就是twitter如何解决这个问题.