Mil*_*ano 7 python url urlparse python-2.7
有一个大文件.此文件的每一行都是由人类输入的URL,因此可能会出现遗漏http丢失www等不同问题.
是否有可以修复这些网址的Python模块?我尝试过url_fix,werkzeug.urls但这并不是我正在寻找的东西.
www.example.com >> http://www.example.com/
Run Code Online (Sandbox Code Playgroud)
当然,没有办法可以修复每一个可能的错误,但我正在寻找修复最常见的错误.
你有什么建议吗?
编辑:根据彼得伍德的评论,让我们假设URL必须包含www.就我而言,这些是eshop网址.