我正在寻找一个正则表达式来解析文件中的所有url.
我尝试了谷歌搜索后获得的许多正则表达式,但在一个或另一个案例中失败了.我的想法是写一个在begening检查http或https的presense,它将匹配所有内容,直到它看到一个空格.
有任何想法吗 ?
注意:我不需要解析网址但删除文件中的所有网址或至少使其无法读取.
Joh*_*yer 59
标准URI库提供了URI.regexp哪个是url字符串的正则表达式.
require 'uri'
string.scan(URI.regexp)
Run Code Online (Sandbox Code Playgroud)
http://ruby-doc.org/stdlib/libdoc/uri/rdoc/index.html
Mar*_*ers 23
你可以试试这个:
/https?:\/\/[\S]+/
Run Code Online (Sandbox Code Playgroud)
这\S意味着任何非空白字符.
| 归档时间: |
|
| 查看次数: |
28498 次 |
| 最近记录: |