筛选输入网址的最佳方法是什么?

JAL*_*JAL 3 xss url parsing input filter

我有一个表单接受来自PHP用户的URL.

我应该允许或禁止哪些角色?目前我用

$ input = preg_replace("/ [^ a-zA-Z0-9 - \?:#.()\,/ \&\'\\"] /","",$ string);

$输入= SUBSTR($输入,0255);

因此,它被修剪为255个字符,只能包含字母,数字和? - _:#(),&'"/

我应该剥离的任何东西,我不是,或者我正在剥离的东西,可能需要在一个有效的URL?

Dav*_*d Z 6

定义URL规范的RFC 1738规定只有字符

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789+.-
Run Code Online (Sandbox Code Playgroud)

可以在URL方案中使用,也可以仅在字符中使用

abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789$-_.+!*'(),;/?:@=&
Run Code Online (Sandbox Code Playgroud)

可以在URL的特定于方案的部分中使用未编码的.(;/?:@=&如果使用未编码,必须用于"保留目的",但如果您只是检查无效字符,则无需担心).因此,如果您想要完全通用,我会检查此正则表达式的URL:

"/([a-zA-Z+.-]+:\/\/)?([a-zA-Z0-9\$\-_\.\+\!\*'\(\),\;\/\?\:\@\=\&]+)/"
Run Code Online (Sandbox Code Playgroud)

(可能一些逃脱不是必要的).如果您只是在寻找HTTP URL,(其中一些)其他答案应该没问题.