这是我试图解析的Twitter消息(正如您所看到的,其中一些不是标记,只是URL的一部分):
#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John
Nack on &#Adobe: Information about Photoshop© CS3 on Snow Leopard
#fail #design</pre>
Run Code Online (Sandbox Code Playgroud)
这个正则表达式是我到目前为止,但它仍然会获取一些url标记:
[##]+([A-Za-z0-9-_]+)
Run Code Online (Sandbox Code Playgroud)