我目前正在学习正则表达式,我试图从带有notepad ++的文档中过滤所有链接(例如:http://www.link.com/folder/file.html).实际上我想删除其他所有内容,以便最终只列出http链接.
到目前为止我试过这个: http\:\/\/www\.[a-zA-Z0-9\.\/\-]+
这给了我所有找到的链接,但是如何删除剩余的东西,以便最终我有一个整齐的所有链接列表?
如果我尝试用\n后面没有任何内容替换它,显然链接将被删除,但我想要完全相反的是删除其他所有内容.
所以它应该是这样的: - 找到一串数字,字母和特殊符号,直到"http" - 删除你找到的东西 - 并继续搜索更多数字,字母和"html"之后的特殊符号 - 并再次删除
有任何想法吗?非常感谢.