如何检查给定字符串是否为有效的URL地址?
我对正则表达式的了解是基本的,不允许我从我在网上看到的数百个正则表达式中进行选择.
首先从URL获取子域很容易.
http://www.domain.example
Run Code Online (Sandbox Code Playgroud)
扫描第一个时间段然后返回"http://"之后的任何内容......
然后你记得
http://super.duper.domain.example
Run Code Online (Sandbox Code Playgroud)
哦.所以,你想,好吧,找到最后一个时期,回过头来获取一切!
然后你记得
http://super.duper.domain.co.uk
Run Code Online (Sandbox Code Playgroud)
而你又回到了原点.除了存储所有顶级域名列表外,任何人都有任何好主意吗?
如何检测(使用正则表达式或启发式方法)一个文本字符串中的网站链接,例如注释?
目的是防止垃圾邮件.HTML被剥离,所以我需要检测复制和粘贴的邀请. 垃圾邮件发送者发布链接应该不经济,因为大多数用户无法成功访问该页面.我想要有关最佳实践的建议,参考或讨论.
一些目标:
http://some-fqdn/some/valid/path.ext)http://前缀(即有效的FQDN +有效的HTTP路径)当然,我阻止垃圾邮件,但可以使用相同的过程来自动链接文本.
以下是我在想的一些事情.
www .example.com"吗?普通用户是否知道自己删除空间,或者做任何浏览器"做什么意思"并为你剥离它?我已经阅读了这些内容,现在它们已在此处记录,因此您可以根据需要参考这些问题中的正则表达式.
哇,我在这里列出了一些非常好的启发式方法!对我来说,最好的砰砰声是以下综合:
这应该使垃圾邮件发送者的CPM足够低,以满足我的需求; "旗帜不合适"的用户反馈应该抓住其他任何东西.列出的其他解决方案也非常有用:
我希望用户提交一个有效的网址,但也是一个图片,以.jpg,.png或.gif结尾.
在我的bash脚本中,我需要从给定的URL中提取路径.例如,从包含字符串的变量:
HTTP://登录:password@example.com/one/more/dir/file.exe一个=某物&B =某物
我想提取到其他变量只有:
/one/more/dir/file.exe
部分.当然登录,密码,文件名和参数是可选的.
由于我是sed和awk的新手,我请求你帮忙.拜托,建议我怎么做.谢谢!
我有一点正则表达式的麻烦.
我想在这个网址中找到路径videoplay.
http://video.google.co.uk:80/videoplay?docid=-7246927612831078230&hl=en#hello
Run Code Online (Sandbox Code Playgroud)
如果我使用这个正则表达式/.+也匹配/video.
我需要某种反/负匹配不包括在内 //
例如:
string = "This is a link http://www.google.com"
Run Code Online (Sandbox Code Playgroud)
我怎样才能提取"http://www.google.com"?
(每个链接的格式相同,即'http://')
我有一个字符串,可能包含几个URL链接(http或https).我需要一个脚本,它将完全从字符串中删除所有这些URL,并返回没有它们的相同字符串.
我到目前为止尝试过:
var url = "and I said http://fdsadfs.com/dasfsdadf/afsdasf.html";
var protomatch = /(https?|ftp):\/\//; // NB: not '.*'
var b = url.replace(protomatch, '');
console.log(b);
Run Code Online (Sandbox Code Playgroud)
但这只会删除http部分并保留链接.
如何编写正确的正则表达式,它将删除http后面的所有内容,并检测字符串中的几个链接?
非常感谢!
我有以下字符串:
http://xxx/Content/SiteFiles/30/32531a5d-b0b1-4a8b-9029-b48f0eb40a34/05%20%20LEISURE.mp3?&mydownloads=true
Run Code Online (Sandbox Code Playgroud)
如何在之后提取零件30/?在这种情况下,它是32531a5d-b0b1-4a8b-9029-b48f0eb40a34.我有另一个字符串具有相同的部分高达30 /并且之后每个字符串具有不同的id到下一个/我想要的.