使用Python修复URL

Mil*_*ano 7 python url urlparse python-2.7

有一个大文件.此文件的每一行都是由人类输入的URL,因此可能会出现遗漏http丢失www等不同问题.

是否有可以修复这些网址的Python模块?我尝试过url_fix,werkzeug.urls但这并不是我正在寻找的东西.

www.example.com >> http://www.example.com/
Run Code Online (Sandbox Code Playgroud)

当然,没有办法可以修复每一个可能的错误,但我正在寻找修复最常见的错误.

你有什么建议吗?

编辑:根据彼得伍德的评论,让我们假设URL必须包含www.就我而言,这些是eshop网址.