将数据从网站刮到pandas数据帧

Question

将数据从网站刮到pandas数据帧

我正试图从会议办公室网站上搜集天气数据,但我一直在收到错误.

这是我到目前为止所尝试的

stats = ['Tmax', 'Tmin', 'Rainfall']
regions = ['England', 'Wales', 'Scotland']
base_url = r'https://www.metoffice.gov.uk/pub/data/weather/uk/climate/datasets/{}/date/{}.txt'
dframes = []

for r in regions:
    for s in stats:
        url = base_url.format(s,r)
        df = pd.read_table(requests.get(url).content)
        dframes.append(df)

Run Code Online (Sandbox Code Playgroud)

我得到一个错误:

"OSError: Expected file path name or file-like object, got <class 'bytes'> type"

Run Code Online (Sandbox Code Playgroud)

Answer 1

eyl*_*esc 6

您必须通过流使用该字节,例如io.BytesIO:

import pandas as pd
import requests
import io

stats = ['Tmax', 'Tmin', 'Rainfall']
regions = ['England', 'Wales', 'Scotland']
base_url = r'https://www.metoffice.gov.uk/pub/data/weather/uk/climate/datasets/{}/date/{}.txt'
dframes = []

for r in regions:
    for s in stats:
        url = base_url.format(s,r)
        df = pd.read_table(io.BytesIO(requests.get(url).content))
        dframes.append(df)
print(dframes)

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，11 月前
查看次数：	230 次
最近记录：	6 年，11 月前