我想访问来自 Google 的前五个(或任何指定数量的)结果链接。经过研究,我发现并修改了以下代码。
import requests
from bs4 import BeautifulSoup
import re
search = raw_input("Search:")
page = requests.get("https://www.google.com/search?q=" + search)
soup = BeautifulSoup(page.content, "lxml")
links = soup.find("a")
print links.get('href')
Run Code Online (Sandbox Code Playgroud)
这将返回页面上的第一个链接,似乎每次都是 Google 图片标签。
这不完全是我想要的。首先,我不想要任何谷歌网站的链接,只想要结果。另外,我想要前三个或五个或任何指定数量的结果。
我如何使用 python 来做到这一点?
提前致谢!
我正在处理一个项目,但我需要使用 Apache Tomcat 来运行我的用户界面。我也在 Ubuntu 上通过 Virtualbox 运行我的项目。我正在关注有关安装 Tomcat 的本教程:https : //www.digitalocean.com/community/tutorials/how-to-install-apache-tomcat-8-on-ubuntu-16-04 但是,当我输入此命令时终点站 :
sudo tar xzvf apache-tomcat-8*tar.gz -C /opt/tomcat --strip-components=1
Run Code Online (Sandbox Code Playgroud)
我收到以下错误:
-C /opt/tomcat --strip-components=1
gzip: stdin: not in gzip format
tar: Child returned status 1
tar: Error is not recoverable: exiting now
Run Code Online (Sandbox Code Playgroud)
我已经研究过这个问题,但仍然不明白或不知道如何解决它。
我究竟做错了什么?