我正在尝试使用复杂的正则表达式来匹配文本正文中的URL.目的是划分文本中的URL.
我想做类似下面的事情
perl -pe 's/regex/left $1 right/g;' inputfile
Run Code Online (Sandbox Code Playgroud)
这将取代由词包围的匹配值的正则表达式的所有事件left和right这只是一个简单的例子来说明这一点-在真实的情景有加载-e表情,我期待再添这一特定匹配的目的.
正则表达式与URL匹配.我意识到匹配的URL是非常困难的,并且可能无法识别所有可能性,但合理的近似值会很好.我在http://daringfireball.net/2010/07/improved_regex_for_matching_urls找到了一个这样的近似值.
但是,我无法使用像上面这样的perl构造中的正则表达式.我尝试过不同的分隔符/,~但没有成功.
字符串:"这是徽章,https: //stackoverflow.com/badges bla bla bla"
如果string contatins一个链接(见上文)我想解析该链接的网站标题.
它应该返回:徽章 - 堆栈溢出.
我怎样才能做到这一点?
谢谢.