RegEx过滤文档的链接

Phi*_*lip 3 regex notepad++

我目前正在学习正则表达式,我试图从带有notepad ++的文档中过滤所有链接(例如:http://www.link.com/folder/file.html).实际上我想删除其他所有内容,以便最终只列出http链接.

到目前为止我试过这个: http\:\/\/www\.[a-zA-Z0-9\.\/\-]+

这给了我所有找到的链接,但是如何删除剩余的东西,以便最终我有一个整齐的所有链接列表?

如果我尝试用\n后面没有任何内容替换它,显然链接将被删除,但我想要完全相反的是删除其他所有内容.

所以它应该是这样的: - 找到一串数字,字母和特殊符号,直到"http" - 删除你找到的东西 - 并继续搜索更多数字,字母和"html"之后的特殊符号 - 并再次删除

有任何想法吗?非常感谢.

psx*_*xls 11

在Notepad ++中,在"替换"菜单(CTRL + H)中,您可以执行以下操作:

  • 找: .*?(http\:\/\/www\.[a-zA-Z0-9\.\/\-]+)
  • 更换: $1\n
  • 选项:检查Regular expression. matches newline

这将返回您所有链接的列表.但有两个问题:

  1. 您为匹配的URL提供的正则表达式远不足以匹配任何URL.如果它适用于您的情况,那很好,否则请检查此问题.
  2. 它将保留最后匹配的URL完整后的文本.您必须手动删除它.