与第三个实例匹配的正则表达式？(蟒蛇)

Question

与第三个实例匹配的正则表达式？(蟒蛇)

我正在尝试创建一个与url中的/的第三个实例匹配的正则表达式,即只记录网站的名称本身,而不是其他内容.

因此http://www.stackoverflow.com/questions/answers/help/在通过正则表达式后将会是http://www.stackoverflow.com

我一直和他们一起玩,并提出:

base_url = re.sub(r'[/].*', r'', url)

Run Code Online (Sandbox Code Playgroud)

但所有这一切都是减少到http的链接: - 所以很明显我需要匹配/的第三个实例 - 任何人都可以解释我将如何做到这一点？

谢谢!

Answer 1

NPE*_*NPE 9

我建议你用它urlparse来解析URL:

In [1]: from urlparse import urlparse

In [2]: urlparse('http://www.stackoverflow.com/questions/answers/help/').netloc
Out[2]: 'www.stackoverflow.com'

Run Code Online (Sandbox Code Playgroud)

.netloc包括端口号(如果存在)(例如www.stackoverflow.com:80); 如果您不想要端口号,请.hostname改用.

归档时间：	14 年，3 月前
查看次数：	269 次
最近记录：	14 年，3 月前