我想使用curl从Google获取结果,以检测潜在的重复内容.是否存在被Google禁止的高风险?
使用脚本语言解析AJAX API的输出相对容易:
#!/usr/bin/env python
import urllib
import json
base = 'http://ajax.googleapis.com/ajax/services/search/web?v=1.0&'
query = urllib.urlencode({'q' : "something"})
response = urllib.urlopen(base + query).read()
data = json.loads(response)
print data['responseData']['results'][0]['url']
Run Code Online (Sandbox Code Playgroud)
但有没有更好的方法来做类似的基本shell脚本?如果你只是卷曲了API页面,你应该如何编码URL参数或解析JSON?
我正在创建一个示例应用程序,它将接受用户的查询并返回从 Google 的“我感觉很幸运”搜索返回的 URL 结果。Google 是否通过其 API 公开此功能?如何访问这个?