从github python下载和访问数据

use*_*418 6 python git pandas

嗨,我正在通过Python进行数据分析,我想分析他在书中经历的数据.在第9章中,他使用下面的数据.但是,一旦我将它下载到mac上的github应用程序,我很难理解如何利用ipython笔记本中的数据.

股票数据在这里:https://github.com/pydata/pydata-book/blob/master/ch09/stock_px.csv

我点击了"打开",它在我的github应用程序上下载了一个大文件.它看起来像下面.如何在ipython笔记本中打开此数据?

**看看其他stackoverflow问题,我知道我只能下载我正在做的zip文件.知道如何有效地使用github应用程序会很酷.

右键单击并保存csv文件似乎保存了json/html文件

在此输入图像描述

Kar*_* D. 9

您应该只能使用url原始版本(原始版本的链接是您提供的链接上的按钮),然后直接使用read_csv以下内容将其读入数据框:

import pandas as pd
url = 'https://raw.githubusercontent.com/pydata/pydata-book/master/ch09/stock_px.csv'
df = pd.read_csv(url,index_col=0,parse_dates=[0])

print df.head(5)

            AAPL   MSFT    XOM     SPX
2003-01-02  7.40  21.11  29.22  909.03
2003-01-03  7.45  21.14  29.24  908.59
2003-01-06  7.45  21.52  29.96  929.01
2003-01-07  7.43  21.93  28.95  922.93
2003-01-08  7.28  21.31  28.83  909.93
Run Code Online (Sandbox Code Playgroud)

编辑:关于我以前在文件中阅读的选项的简要说明:

df = pd.read_csv(url,index_col=0,parse_dates=[0])
Run Code Online (Sandbox Code Playgroud)

第一列(column = 0)是文件中的一列日期,因为它没有列名,所以它看起来像是索引; index_col=0使它成为索引,parse_dates [0]告诉read_csv将column = 0(第一列)解析为日期.