如果我使用urllib2打开文件,如下所示:
remotefile = urllib2.urlopen('http://example.com/somefile.zip')
Run Code Online (Sandbox Code Playgroud)
有没有一种简单的方法来获取文件名,然后解析原始URL?
编辑:将openfile更改为urlopen ...不确定是怎么回事.
编辑2:我最终使用:
filename = url.split('/')[-1].split('#')[0].split('?')[0]
Run Code Online (Sandbox Code Playgroud)
除非我弄错了,否则这也应该删除所有潜在的查询.
我正在处理一个庞大的URL列表.只是一个简单的问题我试图将URL的一部分切出来,见下文:
http://www.domainname.com/page?CONTENT_ITEM_ID=1234¶m2¶m3
Run Code Online (Sandbox Code Playgroud)
我怎么能切出来:
http://www.domainname.com/page?CONTENT_ITEM_ID=1234
Run Code Online (Sandbox Code Playgroud)
有时在CONTENT_ITEM_ID之后有两个以上的参数,并且ID每次都不同,我认为可以通过找到第一个&然后在此之前切掉字符来完成,并且不太确定如何执行此操作.
干杯
如何翻录像http://www.facebook.com/pages/create.php这样的网址,得到如下结果:www.facebook.com?
我试过这种方式,但不起作用:
line.split('/', 2)[2]
Run Code Online (Sandbox Code Playgroud)
我的问题可能是两个正斜杠//和一些URL从www字符串开始.
感谢您的帮助,Adia