作为我正在开展的项目的一部分,我已被指示将Google News API实施到Web应用程序中.
但是,我查看了Google新闻API网站,并看到以下消息:
重要提示:截至2011年5月26日,Google新闻搜索API已正式弃用.它将继续按照我们的弃用政策运作,但您每天可能提出的请求数量可能会有限.
我已经检查了SO问题,但我找不到与News API相关的问题.
我已经检查了Google新闻RSS,但是这使用的HTML description不能满足我的要求,因为我只需要文本.
我有一段使用pygoogle python模块的代码,它允许我以编程方式在google中搜索某些术语:
g = pygoogle(search_term)
g.pages = 1
results = g.get_urls()[0:10]
Run Code Online (Sandbox Code Playgroud)
我发现不幸的是,这已经停止了,取而代之的是谷歌自定义搜索.我查看了SO上的其他相关问题,但没有发现任何我可以使用的问题.我有两个问题:
1)谷歌自定义搜索是否允许我完成我在上面三行中所做的事情?
2)如果是 - 我在哪里可以找到示例代码来完成我上面所做的事情?如果没有,那么使用pygoogle做什么是替代方案?
如何使用Python在Google上执行搜索查询?如何将搜索结果存储在Microsoft Word文档中?
当我搜索“ 什么是2 + 2 ” 时,我试图抓取Google结果,但是下面的代码正在返回'NoneType' object has no attribute 'text'。请帮助我实现所需的目标。
text="What is 2+2"
search=text.replace(" ","+")
link="https://www.google.com/search?q="+search
headers={'User-Agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36'}
source=requests.get(link,headers=headers).text
soup=BeautifulSoup(source,"html.parser")
answer=soup.find('span',id="cwos")
self.respond(answer.text)
Run Code Online (Sandbox Code Playgroud)
唯一的问题是idin soup.find,但是我非常仔细地选择了此id。我不要误会 我也尝试过answer=soup.find('span',class_="cwcot gsrt"),但是都没有用。
我正在尝试在Google图片中搜索一些不同的图片,并使用java Google API保存每个查询的第一个结果.
我设法在Google中搜索并获取包含搜索结果的json对象.该对象包含包含图像的网站,而不包含图像地址
码:
URL url = new URL("https://ajax.googleapis.com/ajax/services/search/images?" +
"v=1.0&q="+properties.getProperty(Integer.toString(i))+"&userip=IP");
URLConnection connection = url.openConnection();
connection.addRequestProperty("Referer", "images.google.com");
String line;
StringBuilder builder = new StringBuilder();
BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream()));
while((line = reader.readLine()) != null) {
builder.append(line);
}
JSONObject json = new JSONObject(builder.toString())
Run Code Online (Sandbox Code Playgroud)
如果我有图像链接,我也知道如何保存图像.
我的问题是如何获得第一个(或第二个或其他)图像正确的地址而不是网址(例如www.yadayadayada.com/image.png)
10倍
我目前正在尝试通过Python获取Google搜索结果列表.
几年前google改变html布局时,许多不同的软件包已停止工作或已被弃用,例如pygoogle,xgoogle
在Google上搜索"远足径洛杉矶",我如何返回前10个结果,理想情况下是网址,标题和描述或其他可用属性?