bee*_*zzz 2 python quantitative-finance pandas
我一直在尝试从网站导入一个html表并将其转换为熊猫DataFrame.这是我的代码:
import pandas as pd
table = pd.read_html("http://www.sharesansar.com/c/today-share-price.html")
dfs = pd.DataFrame(data = table)
print dfs
Run Code Online (Sandbox Code Playgroud)
它只显示这个:
0 S.No ...
Run Code Online (Sandbox Code Playgroud)
但是,如果我这样做;
for df in dfs:
print df
Run Code Online (Sandbox Code Playgroud)
它输出表..
我怎样才能使用pd.Dataframe刮表?
给定网址上的HTML表格是javascript呈现的.pd.read_html()不支持javascript呈现的页面.您可以尝试dryscrape这样:
import pandas as pd
import dryscrape
s = dryscrape.Session()
s.visit("http://www.sharesansar.com/c/today-share-price.html")
df = pd.read_html(s.body())[5]
df.head()
Run Code Online (Sandbox Code Playgroud)
输出: