使用Python将字符串URL拆分为单词

Sha*_* Ab 2 python url split

如何从python中的字符串(URL)中获取各种单词?来自以下网址:

http://www.sample.com/level1/level2/index.html?id=1234
Run Code Online (Sandbox Code Playgroud)

我想得到像这样的话:

http, www, sample, com, level1, level2, index, html, id, 1234
Run Code Online (Sandbox Code Playgroud)

使用python的任何解决方案.

谢谢.

Sar*_*lai 5

这是您为所有URL执行此操作的方式

import re
def getWordsFromURL(url):
    return re.compile(r'[\:/?=\-&]+',re.UNICODE).split(url)
Run Code Online (Sandbox Code Playgroud)

现在你可以用它作为

url = "http://www.sample.com/level1/level2/index.html?id=1234"
words = getWordsFromURL(url)
Run Code Online (Sandbox Code Playgroud)