我经常使用Google搜索文档(主要是PDF).但是当我右键单击链接时,或者只是将鼠标光标悬停在它上面.我得到的不是真正的链接,但有些东西长而混淆如下:
http://www.google.com/url?sa=t&source=web&cd=1&ved=0CCUQFjAA&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf&ei=Fai1TZq-Acugtgenw6DqDg&usg=AFQjCNFzYOTqpf68rQnuwW9K7wp39WL6Rg&sig2=z4RqvOLEEJsPohBqr1ghxQ
Run Code Online (Sandbox Code Playgroud)
我不知道这是什么,但我知道这个废话不是我想要的,我想要真正的链接(对于上面的那个:) http://www.marxists.org/reference/archive/einstein/works/1910s/relative/relativity.pdf,而不是谷歌干预的东西.
如何获取Google搜索结果中的"真实"链接?
dlm*_*dlm 43
也许这不是最好的解决方案,但这是一种不需要为Chrome和Firefox编码或附加组件的方法.假设有类似的方法为IE和其他人这样做,但至少IE通常会在浏览器中打开PDF,顶部的URL栏中的链接很容易复制.
单击搜索结果,该结果应下载PDF.
现在在浏览器中打开最近下载列表
现在复制链接
bra*_*ilo 18
从@Blender回答的评论中,我学会了如何在Firefox和Chrome中安装用户脚本.
现在,当右键点击并复制Google搜索结果中的网址时,我会得到真正的链接,而不是那些垃圾(对不起,谷歌,我知道你爱我们,但我们不需要任何臭的跟踪网址).
起初,我按照@naxa的建议使用了googlePrivacy,但现在它正在喋喋不休.Web Applicatations SE中提供的脚本,关闭Google搜索结果间接,可以完成工作.它具有用户脚本和扩展名的风格:
关于如何继续使用用户脚本的信息.
在Chrome中,我使用Tampermonkey安装了它.
和Firefox中的Greasemonkey.
Web应用程序中的相关帖子:
Ble*_*der 10
网址就在这里:
&url=http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf
Run Code Online (Sandbox Code Playgroud)
只是用一些语言来解决它,比如Python:
>>> import urllib
>>> print urllib.unquote('http%3A%2F%2Fwww.marxists.org%2Freference%2Farchive%2Feinstein%2Fworks%2F1910s%2Frelative%2Frelativity.pdf')
http://www.marxists.org/reference/archive/einstein/works/1910s/relative/relativity.pdf
Run Code Online (Sandbox Code Playgroud)
因此,要从Google网址中提取网址,请执行以下操作:
import urllib
url = raw_input('What is the Google url? ')
url = url[url.find('&url=') + 5:]
url = url[:url.find('&')]
print urllib.unquote(url)
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
30419 次 |
| 最近记录: |