小编Log*_*ogs的帖子

如何使用 Beautifulsoup 访问前五个 Google 结果链接

我想访问来自 Google 的前五个(或任何指定数量的)结果链接。经过研究,我发现并修改了以下代码。

import requests
from bs4 import BeautifulSoup
import re    
search = raw_input("Search:")
page = requests.get("https://www.google.com/search?q=" + search)
soup = BeautifulSoup(page.content, "lxml")
links = soup.find("a")
print links.get('href')
Run Code Online (Sandbox Code Playgroud)

这将返回页面上的第一个链接,似乎每次都是 Google 图片标签。

这不完全是我想要的。首先,我不想要任何谷歌网站的链接,只想要结果。另外,我想要前三个或五个或任何指定数量的结果。

我如何使用 python 来做到这一点?

提前致谢!

python url beautifulsoup hyperlink google-search

5
推荐指数
2
解决办法
4118
查看次数

安装 Tomcat (Ubuntu) 时出现 gzip 和 tar 错误

我正在处理一个项目,但我需要使用 Apache Tomcat 来运行我的用户界面。我也在 Ubuntu 上通过 Virtualbox 运行我的项目。我正在关注有关安装 Tomcat 的本教程:https : //www.digitalocean.com/community/tutorials/how-to-install-apache-tomcat-8-on-ubuntu-16-04 但是,当我输入此命令时终点站 :

sudo tar xzvf apache-tomcat-8*tar.gz -C /opt/tomcat --strip-components=1
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

-C /opt/tomcat --strip-components=1

gzip: stdin: not in gzip format
tar: Child returned status 1
tar: Error is not recoverable: exiting now
Run Code Online (Sandbox Code Playgroud)

我已经研究过这个问题,但仍然不明白或不知道如何解决它。

我究竟做错了什么?

java apache terminal ubuntu tomcat

5
推荐指数
2
解决办法
3721
查看次数