edt*_*edt 2 javascript regex twitter
假设我将推文存储为JS变量中的字符串...
如何使用JavaScript RegEx从推文中提取URL?
这比从字符串中提取URL要容易得多,因为:
我将假设以http或www开头并以空格(或推文结尾)结尾的任何内容都是URL.
arc*_*ain 11
这是我用来从Twitter状态中提取链接的正则表达式之一.
链接匹配模式
(?:<\w+.*?>|[^=!:'"/]|^)((?:https?://|www\.)[-\w]+(?:\.[-\w]+)*(?::\d+)?(?:/(?:(?:[~\w\+%-]|(?:[,.;@:][^\s$]))+)?)*(?:\?[\w\+%&=.;:-]+)?(?:\#[\w\-\.]*)?)(?:\p{P}|\s|<|$)
Run Code Online (Sandbox Code Playgroud)
或者,如果您控制从Twitter获取状态的方式,您可以将include_entities参数传递给statuses/show(或支持它的任何其他方法,例如statuses/user_timeline),以使Twitter突破链接,提及和主题标签你,如下:
http://api.twitter.com/1/statuses/show/23918022347456512.json?include_entities=true
在结果JSON中,注意实体对象.
"entities":{"urls":[{"expanded_url":null,"indices":[27,53],"url":"http:\/\/tinyurl.com\/38wp7nt"}],"hashtags":[],"user_mentions":[]}
Run Code Online (Sandbox Code Playgroud)
现在,您可以引用从Twitter返回的数据,而不必自己解析它.关于这种方法的最好的事情是你将工作卸载到Twitter,并且永远不必担心你的正则表达式是否与Twitter完全匹配.
| 归档时间: |
|
| 查看次数: |
2908 次 |
| 最近记录: |