Dan*_*ura 6 java regex twitter
这是我试图解析的Twitter消息(正如您所看到的,其中一些不是标记,只是URL的一部分):
#anothertag Arrogance and bad PR http://www.adobe.com/index.html#anchor1. John
Nack on &#Adobe: Information about Photoshop© CS3 on Snow Leopard
#fail #design</pre>
Run Code Online (Sandbox Code Playgroud)
这个正则表达式是我到目前为止,但它仍然会获取一些url标记:
[##]+([A-Za-z0-9-_]+)
Run Code Online (Sandbox Code Playgroud)
这不具讽刺意味,一发帖我就找到了答案.因此,如果您正在寻找匹配模式来执行此操作,以下似乎可行:
(?:\ S |\A)[##] +([A-ZA-Z0-9 -_] +)
我将对此进行更多测试,以查看是否存在超出此表达式范围的任何边缘情况,如果发现任何情况,将报告回来.
| 归档时间: |
|
| 查看次数: |
8915 次 |
| 最近记录: |