Python 错误:“NoneType”对象没有属性“find_all”

use*_*610 3 python object attributeerror nonetype

我正在改编来自http://danielfrg.com/blog/2013/04/01/nba-scraping-data/#disqus_thread的网络抓取程序,以将 ESPN 的棒球数据抓取到 CSV 中。但是,当我运行第二段代码来编写一个 csv 游戏时,我从以下代码部分得到“NoneType”对象没有属性“find_all”错误

for index, row in teams.iterrows():
    _team, url = row['team'], row['url']
    r = requests.get(BASE_URL.format(row['prefix_1'], year, row['prefix_2']))
    table = BeautifulSoup(r.text).table
    for row in table.find_all("tr")[1:]: # Remove header
        columns = row.find_all('td')
        try:
            _home = True if columns[1].li.text == 'vs' else False
            _other_team = columns[1].find_all('a')[1].text
            _score = columns[2].a.text.split(' ')[0].split('-')
            _won = True if columns[2].span.text == 'W' else False

            match_id.append(columns[2].a['href'].split('?id=')[1])
            home_team.append(_team if _home else _other_team)
            visit_team.append(_team if not _home else _other_team)
            d = datetime.strptime(columns[0].text, '%a, %b %d')
            dates.append(date(year, d.month, d.day))
Run Code Online (Sandbox Code Playgroud)

我可以发布整个程序,但这是编译器读取错误的代码段。

完整的错误文本是

Traceback (most recent call last):
  File "C:\Python27\Project Files\Game Parser.py", line 23, in <module>
    for row in table.find_all("tr")[1:]: # Remove header
AttributeError: 'NoneType' object has no attribute 'find_all'
Run Code Online (Sandbox Code Playgroud)

任何有关如何运行此代码的帮助将不胜感激。

sha*_*aan 5

该错误意味着table您正在通过执行以下操作来构建变量:

table = BeautifulSoup(r.text).table
Run Code Online (Sandbox Code Playgroud)

正在返回None。并且for row in table.find_all("tr")[1:]:在 aNone上抛出错误。

您可以检查有url问题的表格是否以您尝试访问的方式存在。您可以通过打印出url由该语句构造的语句来完成此操作:

BASE_URL.format(row['prefix_1'], year, row['prefix_2'])
Run Code Online (Sandbox Code Playgroud)

然后在浏览器中访问此 url 以检查它是否包含您感兴趣的表格。