使用Google datalab读取文件

vvv*_*vvv 6 google-api-python-client google-cloud-datalab

我正在尝试使用Google Datalab读取ipython笔记本中的文件,基本的pd.read_csv(),因为我无法找到该文件的路径.我在本地拥有它,并将其上传到桶中的谷歌云存储.

我运行以下命令来了解我的位置

os.getcwd()
Run Code Online (Sandbox Code Playgroud)

给'/content/myemail@gmail.com'

os.listdir('/content/myemail@gmail.com')
Run Code Online (Sandbox Code Playgroud)

给['.git','.gitignore','datalab','Hello World.ipynb','.ipynb_checkpoints']

Chr*_*ris 10

下面将对象的内容读入一个名为的字符串变量text:

%%storage read --object "gs://path/to/data.csv" --variable text
Run Code Online (Sandbox Code Playgroud)

然后

from cStringIO import StringIO
mydata = pd.read_csv(StringIO(text)) 
mydata.head()
Run Code Online (Sandbox Code Playgroud)

希望Pandas支持"gs://"URL(就像s3://目前允许直接从Google Cloud存储中读取一样).

我发现以下文档非常有用:

https://github.com/GoogleCloudPlatform/datalab/tree/master/content/datalab/tutorials

希望有所帮助(也只是开始使用Datalab,所以也许有人会很快采用更清洁的方法).