我url来自用户,我必须回复提取的HTML.
如何检查URL是否格式错误?
例如 :
url='google' // Malformed
url='google.com' // Malformed
url='http://google.com' // Valid
url='http://google' // Malformed
Run Code Online (Sandbox Code Playgroud)
我们怎样才能做到这一点?
我URLValidator在表单中以下列方式使用Django :
def clean_url(self):
validate = URLValidator(verify_exists=True)
url = self.cleaned_data.get('url')
try:
logger.info(url)
validate(url)
except ValidationError, e:
logger.info(e)
raise forms.ValidationError("That website does not exist. Please try again.")
return self.cleaned_data.get('url')
Run Code Online (Sandbox Code Playgroud)
它似乎适用于某些网址,但对于某些有效网址,它会失败.我能够通过http://www.amazon.com/检查它是否失败(这显然是不正确的).它通过http://www.cisco.com/.是否存在伪造错误的原因?