将html表转换为pandas数据帧

bee*_*zzz 2 python quantitative-finance pandas

我一直在尝试从网站导入一个html表并将其转换为熊猫DataFrame.这是我的代码:

import pandas as pd
table = pd.read_html("http://www.sharesansar.com/c/today-share-price.html")
dfs = pd.DataFrame(data = table)
print dfs 
Run Code Online (Sandbox Code Playgroud)

它只显示这个:

0       S.No                                     ...
Run Code Online (Sandbox Code Playgroud)

但是,如果我这样做;

for df in dfs:
    print df
Run Code Online (Sandbox Code Playgroud)

它输出表..

我怎样才能使用pd.Dataframe刮表?

MYG*_*YGz 5

给定网址上的HTML表格是javascript呈现的.pd.read_html()不支持javascript呈现的页面.您可以尝试dryscrape这样:

import pandas as pd
import dryscrape

s = dryscrape.Session()
s.visit("http://www.sharesansar.com/c/today-share-price.html")
df = pd.read_html(s.body())[5]
df.head()
Run Code Online (Sandbox Code Playgroud)

输出:

在此输入图像描述