RegEx过滤文档的链接

Question

我目前正在学习正则表达式,我试图从带有notepad ++的文档中过滤所有链接(例如:http://www.link.com/folder/file.html).实际上我想删除其他所有内容,以便最终只列出http链接.

到目前为止我试过这个: http\:\/\/www\.[a-zA-Z0-9\.\/\-]+

这给了我所有找到的链接,但是如何删除剩余的东西,以便最终我有一个整齐的所有链接列表？

如果我尝试用\n后面没有任何内容替换它,显然链接将被删除,但我想要完全相反的是删除其他所有内容.

所以它应该是这样的: - 找到一串数字,字母和特殊符号,直到"http" - 删除你找到的东西 - 并继续搜索更多数字,字母和"html"之后的特殊符号 - 并再次删除

有任何想法吗？非常感谢.

Answer 1

在Notepad ++中,在"替换"菜单(CTRL + H)中,您可以执行以下操作:

这将返回您所有链接的列表.但有两个问题: