我上传了一个文件到Google电子表格(用于制作一个公开可访问的示例IPython Notebook,带有数据)我正在使用该文件的原生形式可以读入Pandas Dataframe.所以现在我使用下面的代码来阅读电子表格,工作正常,但只是作为字符串,我没有任何运气试图让它回到数据帧(你可以得到数据)
import requests
r = requests.get('https://docs.google.com/spreadsheet/ccc?key=0Ak1ecr7i0wotdGJmTURJRnZLYlV3M2daNTRubTdwTXc&output=csv')
data = r.content
Run Code Online (Sandbox Code Playgroud)
数据最终看起来像:(第1行标题)
',City,region,Res_Comm,mkt_type,Quradate,National_exp,Alabama_exp,Sales_exp,Inventory_exp,Price_exp,Credit_exp\n0,Dothan,South_Central-Montgomery-Auburn-Wiregrass-Dothan,Residential,Rural,1/15/2010,2,2,3,2,3,3\n10,Foley,South_Mobile-Baldwin,Residential,Suburban_Urban,1/15/2010,4,4,4,4,4,3\n12,Birmingham,North_Central-Birmingham-Tuscaloosa-Anniston,Commercial,Suburban_Urban,1/15/2010,2,2,3,2,2,3\n
Run Code Online (Sandbox Code Playgroud)
引入磁盘驻留文件的本机pandas代码如下所示:
df = pd.io.parsers.read_csv('/home/tom/Dropbox/Projects/annonallanswerswithmaster1012013.csv',index_col=0,parse_dates=['Quradate'])
Run Code Online (Sandbox Code Playgroud)
一个"干净"的解决方案将有助于许多人提供一种简单的方法来共享数据集供熊猫使用!我尝试了一堆替代方案但没有成功,我很确定我再次错过了一些明显的东西.
只是一个更新说明新的Google电子表格有不同的网址格式只是在上面的例子和/或下面的答案中使用它来代替URL,你应该没问题就是一个例子:
https://docs.google.com/spreadsheets/d/177_dFZ0i-duGxLiyg6tnwNDKruAYE-_Dd8vAQziipJQ/export?format=csv&id
Run Code Online (Sandbox Code Playgroud)
从@Max Ghenis看下面的解决方案,它只使用了pd.read_csv,不需要StringIO或请求......
我正在尝试读取我在本机上存储的csv文件.(只为额外的参考是从Kaggle泰坦尼克号的数据是在这里.)
从这个问题和答案我了解到你可以使用这个代码导入数据,这对我很有用.
from google.colab import files
uploaded = files.upload()
Run Code Online (Sandbox Code Playgroud)
丢失的地方是如何从这里将其转换为数据帧.上面答案中列出的示例谷歌笔记本页面没有谈到它.
我试图uploaded
使用from_dict
命令将字典转换为数据帧,但无法使其工作.有上转换字典内数据帧的一些讨论,在这里,但解决方案并不适用于我(我认为).
总结一下,我的问题是:
How do I convert a csv file stored locally on my files to pandas
datframe on google-colaboratory?
Run Code Online (Sandbox Code Playgroud) 我想运行一个使用目录中定义的许多头文件的笔记本。所以基本上我想将整个目录上传到 Google Colab,以便我可以运行笔记本。但是我找不到任何这样的选项,只能上传文件而不是完整的文件夹。那么有人可以告诉我如何将整个目录上传到 google colab 吗?
我有file.npy
,我想在Google Colaboratory Notebook中加载它.我已经知道我必须从Google云端硬盘加载该文件,但我不知道该怎么做.
欢迎任何帮助
我的Google云端硬盘上有图像数据集.我在压缩的.zip版本和未压缩的文件夹中都有这个数据集.
我想用Google Colab训练CNN.如何告诉Colab我的Google云端硬盘中的图片在哪里?
我希望有人可以解释我需要做什么或告诉我在哪里寻求帮助.
EDIT1:
我找到了另一个问题与我相同的问题:遗憾的是,在3个答案中,有两个提到Kaggle,我不知道也不使用.第三个答案提供了两个链接.第一个链接指的是我链接的第三个线程,第二个链接仅解释了如何手动上传单个文件.
尝试使用Google Collaboratory通过这种方式上传本地文件:
from google.colab import files
uploaded = files.upload()
Run Code Online (Sandbox Code Playgroud)
我收到以下错误:
仅当在当前浏览器会话中执行了单元格时,上载小部件才可用。请重新运行此单元格以启用。
我重新运行单元,但是它不起作用...
我有一个 Jupyter 笔记本,并且编写了处理数据的代码。现在我想使用 Google Colab,因为它的 GPU 计算能力,所以我需要从 Colab 读取和写入计算机中的本地文件。我不想使用以下命令手动选择文件:
from google.colab import files
uploaded = files.upload()
Run Code Online (Sandbox Code Playgroud)
在此链接中提到,将出现“选择文件”弹出窗口,我希望自动执行此操作。让我澄清一下:
我在下面的代码中从本地文件读取数据:
# Reading the csv file and convert it to a dataframe using pandas library
train_set = pd.read_csv('Datasets/train.csv')
Run Code Online (Sandbox Code Playgroud)
然后我对每个处理数据并将结果输出到另一个文件中。为此,我需要打开一个文件,读取其中的内容(即我创建的输出文件的版本),然后保存输出文件:
output_version = open('OutputVersion','r+')
version = output_version.read()
training_set.to_csv('Datasets/training_set_processed_{}.csv'.format(version))
Run Code Online (Sandbox Code Playgroud)
因此,我必须自动从 Colab 读取、操作和写入本地存储中的文件。我怎样才能做到这一点?我已阅读本手册,但我无法理解。再说一次,我不想要弹出“选择文件”对话框。
提前致谢
local-storage python-3.x jupyter-notebook google-colaboratory
我从这个Kaggle链接下载了大图像训练数据作为zip
https://www.kaggle.com/c/yelp-restaurant-photo-classification/data
我如何有效地实现以下目标?
谢谢
编辑:我尝试了下面的代码,但它崩溃了我的大型zip文件.有没有更好/更有效的方法来执行此操作,我可以在本地驱动器中指定文件的位置?
from google.colab import files
uploaded = files.upload()
for fn in uploaded.keys():
print('User uploaded file "{name}" with length {length} bytes'.format(
name=fn, length=len(uploaded[fn])))
Run Code Online (Sandbox Code Playgroud) python google-drive-api deep-learning jupyter-notebook google-colaboratory
我想使用 Google Photo 创建相册,然后使用该相册作为图像源。我四处搜索并找到了一些将 python 与 Google Photos API 结合使用的示例,但这似乎没有被太多使用或根本没有使用。
是否有将相册导入 Google Colab 的最佳实践?性能是否可能是一个问题,因此其他选择会更好?