小编Log*_*ogs的帖子

如何使用 Beautifulsoup 访问前五个 Google 结果链接

我想访问来自 Google 的前五个（或任何指定数量的）结果链接。经过研究，我发现并修改了以下代码。

import requests
from bs4 import BeautifulSoup
import re    
search = raw_input("Search:")
page = requests.get("https://www.google.com/search?q=" + search)
soup = BeautifulSoup(page.content, "lxml")
links = soup.find("a")
print links.get('href')

Run Code Online (Sandbox Code Playgroud)

这将返回页面上的第一个链接，似乎每次都是 Google 图片标签。

这不完全是我想要的。首先，我不想要任何谷歌网站的链接，只想要结果。另外，我想要前三个或五个或任何指定数量的结果。

我如何使用 python 来做到这一点？

提前致谢！

python url beautifulsoup hyperlink google-search

Log*_*ogs

lucky-day

5
推荐指数

2
解决办法

4118
查看次数

安装 Tomcat (Ubuntu) 时出现 gzip 和 tar 错误

我正在处理一个项目，但我需要使用 Apache Tomcat 来运行我的用户界面。我也在 Ubuntu 上通过 Virtualbox 运行我的项目。我正在关注有关安装 Tomcat 的本教程：https : //www.digitalocean.com/community/tutorials/how-to-install-apache-tomcat-8-on-ubuntu-16-04 但是，当我输入此命令时终点站：

sudo tar xzvf apache-tomcat-8*tar.gz -C /opt/tomcat --strip-components=1

Run Code Online (Sandbox Code Playgroud)

我收到以下错误：

-C /opt/tomcat --strip-components=1

gzip: stdin: not in gzip format
tar: Child returned status 1
tar: Error is not recoverable: exiting now

Run Code Online (Sandbox Code Playgroud)

我已经研究过这个问题，但仍然不明白或不知道如何解决它。

我究竟做错了什么？

java apache terminal ubuntu tomcat

Log*_*ogs

lucky-day

5
推荐指数

2
解决办法

3721
查看次数

标签统计

apache ×1

beautifulsoup ×1

google-search ×1

hyperlink ×1

java ×1

python ×1

terminal ×1

tomcat ×1

ubuntu ×1

url ×1

如何使用 Beautifulsoup 访问前五个 Google 结果链接

安装 Tomcat (Ubuntu) 时出现 gzip 和 tar 错误

标签 统计

小编Log_ogs的帖子

标签统计