pd.read_html()导入列表而不是数据帧

AlK*_*AlK 11 html python pandas

我曾经pd.read_html()从网页导入一个表,但不是将数据结构化为数据帧,而是将Python作为列表导入.如何将数据作为数据框导入?谢谢!

代码如下:

import pandas as pd

import html5lib

url = 'http://www.fdic.gov/bank/individual/failed/banklist.html'

dfs = pd.read_html(url)

type(dfs)

Out[1]: list
Run Code Online (Sandbox Code Playgroud)

ale*_*cxe 9

.read_html()生成一个数据帧列表(HTML源中可能有多个表),通过索引获得所需的数据帧.在您的情况下,有一个数据帧:

dfs = pd.read_html(url)
df = dfs[0]
print(df)
Run Code Online (Sandbox Code Playgroud)

请注意,如果tableHTML源代码中没有s,则会返回错误并且永远不会生成空列表.

  • @AlexanderKonstantinidis 啊,它是`tail`、`head` 和`index` - 没有`s` 前缀和`()`(这些不是方法)。 (2认同)

小智 7

import pandas as pd
import html5lib
url = 'http://www.fdic.gov/bank/individual/failed/banklist.html'
dfs = pd.read_html(url)
df = pd.concat(dfs)
df
Run Code Online (Sandbox Code Playgroud)