可能重复: 哪个字符使网址无效?
我正在尝试删除大字符串的非URL部分.我发现的大多数正则表达式都是这样的[A-Za-z0-9-_.!~*'()],但是有更多可以包含url的东西.像http://127.0.0.1:8080/test?v=123#this例如
[A-Za-z0-9-_.!~*'()]
http://127.0.0.1:8080/test?v=123#this
那么有效网址的最新字符是什么?
编辑:
他们似乎是:
A-Za-z0-9 -._〜:/?#[] @!$&'()*+ ,; =和%后跟十六进制值
html url
html ×1
url ×1