如何在javascript中拉出像twitter这样的字符串

jpo*_*s18 16 javascript regex twitter node.js

我正在Node.js中编写一个应用程序,允许用户在Twitter上的消息中互相提及.我希望能够找到用户并向他们发送通知.为了做到这一点,我需要拉@usernames从node.js中的字符串中查找提及?

任何建议,正则表达式,问题?

jpo*_*s18 36

我发现这是在javascript中查找字符串内部提及的最佳方法.

var str = "@jpotts18 what is up man? Are you hanging out with @kyle_clegg";
var pattern = /\B@[a-z0-9_-]+/gi;
str.match(pattern);
["@jpotts18", "@kyle_clegg"]
Run Code Online (Sandbox Code Playgroud)

我故意将它限制为大写和小写字母数字和( - ,_)符号,以避免可能混淆像(@j.potts)这样的用户名的句点.

这就是twitter-text.js在幕后所做的事情.

// Mention related regex collection
twttr.txt.regexen.validMentionPrecedingChars = /(?:^|[^a-zA-Z0-9_!#$%&*@?]|RT:?)/;
twttr.txt.regexen.atSigns = /[@?]/;
twttr.txt.regexen.validMentionOrList = regexSupplant(
    '(#{validMentionPrecedingChars})' +  // $1: Preceding character
    '(#{atSigns})' +                     // $2: At mark
    '([a-zA-Z0-9_]{1,20})' +             // $3: Screen name
    '(\/[a-zA-Z][a-zA-Z0-9_\-]{0,24})?'  // $4: List (optional)
  , 'g');
twttr.txt.regexen.endMentionMatch = regexSupplant(/^(?:#{atSigns}|[#{latinAccentChars}]|:\/\/)/);
Run Code Online (Sandbox Code Playgroud)

如果你使用了更有效或更准确的东西,请告诉我.谢谢!

  • yoo还可以在'@'之前添加一个单词分隔符,以确保你不会意外地捕获电子邮件:var str ="@ jpotts18什么是男人?你和@kyle_clegg一起出去玩,请通过foo@bar.com与我联系"; str.match(/ \乙@ [A-Z0-9 _-] +/GI); (8认同)
  • 这也将匹配单个`@`.为了防止你可以用`+`替换`*` (3认同)

Nic*_*son 6

Twitter 有一个库,您应该可以使用它。https://github.com/twitter/twitter-text-js

我没有使用过它,但如果你相信它的描述,“该库提供了 URL、用户名、列表和主题标签的自动链接和提取。”。您应该可以在 Node 中使用它npm install twitter-text

虽然我知道您不是在寻找 Twitter 用户名,但相同的逻辑仍然适用,您应该可以很好地使用它(它不会验证提取的用户名是否是有效的 Twitter 用户名)。如果没有,为自己的目的分叉它可能是一个很好的起点。

编辑:我看了看文档近了,有你需要正确的东西一个很好的例子在这里

var usernames = twttr.txt.extractMentions("Mentioning @twitter and @jack")
// usernames == ["twitter", "jack"]
Run Code Online (Sandbox Code Playgroud)