soup.select('.r a') in f'https://google.com/search?q={query}' 在 Python BeautifulSoup 中带回空列表。**不是复制品**

Zac*_*ché 1 python beautifulsoup python-webbrowser python-requests

“我很幸运!” “使用 Python 自动化无聊的东西”电子书中的项目不再使用他提供的代码。

具体来说,linkElems = soup.select('.r a')

我已经尝试使用以下提供的解决方案: soup.select('.r a') in 'https://www.google.com/#q=vigilante+mic' 在 python BeautifulSoup 中给出空列表

,我目前使用相同的搜索格式。

import webbrowser, requests, bs4

def im_feeling_lucky():

    # Make search query look like Google's
    search = '+'.join(input('Search Google: ').split(" "))

    # Pull html from Google
    print('Googling...') # display text while downloading the Google page
    res = requests.get(f'https://google.com/search?q={search}&oq={search}')
    res.raise_for_status()

    # Retrieve top search result link
    soup = bs4.BeautifulSoup(res.text, features='lxml')


    # Open a browser tab for each result.
    linkElems = soup.select('.r')  # Returns empty list
    numOpen = min(5, len(linkElems))
    print('Before for loop')
    for i in range(numOpen):
        webbrowser.open(f'http://google.com{linkElems[i].get("href")}')
Run Code Online (Sandbox Code Playgroud)

linkElems 变量返回一个空列表 [] 并且程序在此之后不会做任何事情。

Ara*_*tty 5

我在阅读那本书时也遇到了同样的问题,并找到了解决该问题的方法。

替换

soup.select('.r a')
Run Code Online (Sandbox Code Playgroud)

soup.select('div#main > div > div > div > a')
Run Code Online (Sandbox Code Playgroud)

将解决这个问题

以下是可以工作的代码

import webbrowser, requests, bs4 , sys

print('Googling...')
res = requests.get('https://google.com/search?q=' + ' '.join(sys.argv[1:]))
res.raise_for_status()

soup = bs4.BeautifulSoup(res.text)

linkElems = soup.select('div#main > div > div > div > a')  
numOpen = min(5, len(linkElems))
for i in range(numOpen):
    webbrowser.open('http://google.com' + linkElems[i].get("href"))
Run Code Online (Sandbox Code Playgroud)

上面的代码从命令行参数中获取输入