我正在寻找一个库函数来规范化Python中的URL,即删除路径中的"./"或"../"部分,或添加默认端口或转义特殊字符等.结果应该是一个字符串,对于指向同一网页的两个URL是唯一的.例如http://google.com,http://google.com:80/a/../应返回相同的结果.
我更喜欢Python 3并且已经查看了urllib模块.它提供了分割URL的功能,但没有规范它们的功能.Java具有URI.normalize()执行类似操作的功能(虽然它不认为默认端口80等于没有给定端口),但是这样的东西是python吗?
我需要唯一标识和存储一些URL.问题是,有时它们会包含"......" http://somedomain.com/foo/bar/../../some/url,http://somedomain.com/some/url如果我没有错,基本上就是这样.
是否有Python函数或解决此URL的棘手方法?