在谷歌colab中读取csv到dataframe

Pag*_*Max 21 python csv dataframe google-colaboratory

我正在尝试读取我在本机上存储的csv文件.(只为额外的参考是从Kaggle泰坦尼克号的数据是在这里.)

这个问题和答案我了解到你可以使用这个代码导入数据,这对我很有用.

from google.colab import files
uploaded = files.upload()
Run Code Online (Sandbox Code Playgroud)

丢失的地方是如何从这里将其转换为数据帧.上面答案中列出的示例谷歌笔记本页面没有谈到它.

我试图uploaded使用from_dict命令将字典转换为数据帧,但无法使其工作.有上转换字典内数据帧的一些讨论,在这里,但解决方案并不适用于我(我认为).

总结一下,我的问题是:

How do I convert a csv file stored locally on my files to pandas 
datframe on google-colaboratory?
Run Code Online (Sandbox Code Playgroud)

Bob*_*ith 29

熊猫read_csv应该做的伎俩.你需要将上传的字节包装成一个,io.StringIO因为它read_csv需要一个类似文件的对象.

以下是一个完整的示例:https: //colab.research.google.com/notebook#fileId=1JmwtF5OmSghC-y3-BkvxLan0zYXqCJJf

关键片段是:

import pandas as pd
import io

df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8')))
df
Run Code Online (Sandbox Code Playgroud)

  • 谢谢 。@Bob Smith我已经使用了你的解决方案,它有效。您还可以提供我如何使用谷歌驱动器中已有的 csv 文件吗? (2认同)
  • [安装您的 Google Drive](https://colab.research.google.com/notebooks/io.ipynb#scrollTo=RWSJpsyKqHjH) 然后从那里读取,例如`/content/gdrive/My\ Drive/train.csv `. (2认同)

Gar*_*ain 15

第1步-将您的Google云端硬盘安装到协作

from google.colab import drive 
drive.mount('/content/gdrive')
Run Code Online (Sandbox Code Playgroud)

第2步-现在,您将在左窗格(文件资源管理器)中看到您的Google云端硬盘文件。右键单击您需要导入的文件,然后选择çopypath。然后,使用此复制的路径照常导入熊猫。

import pandas as pd 
df=pd.read_csv('gdrive/My Drive/data.csv')
Run Code Online (Sandbox Code Playgroud)

做完了!


Yas*_*r M 9

Colab google:从您的 PC 上传 csv 我遇到了与 excel 文件 (*.xlsx) 相同的问题,我解决了以下问题,我认为您可以对 csv 文件执行相同的操作: - 如果您的文件中有一个文件PC 驱动器称为 (file.xlsx) 然后: 1- 使用以下简单代码从您的硬盘驱动器上传它:

from google.colab import files
uploaded = files.upload()
Run Code Online (Sandbox Code Playgroud)

按(选择文件)并将其上传到您的谷歌驱动器。

2-然后:

import io
data = io.BytesIO(uploaded['file.XLSX'])    
Run Code Online (Sandbox Code Playgroud)

3- 最后,阅读您的文件:

import pandas as pd   
f = pd.read_excel(data , sheet_name = '1min', header = 0, skiprows = 2)
#df.sheet_names
df.head()
Run Code Online (Sandbox Code Playgroud)

4- 请更改参数值以读取您自己的文件。我认为这可以推广到读取其他类型的文件!
好好享受!


JAR*_*ARS 5

这对我有用:

from google.colab import auth
auth.authenticate_user()

from pydrive.drive import GoogleDrive
from pydrive.auth import GoogleAuth
from oauth2client.client import GoogleCredentials
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

myfile = drive.CreateFile({'id': '!!!YOUR FILE ID!!!'})
myfile.GetContentFile('file.csv')
Run Code Online (Sandbox Code Playgroud)

替换!!!YOUR FILE ID!!!为 google drive 中文件的 id(这是单击“获取共享链接”时出现的长字母数字字符串)。然后你可以使用pandas的read_csv访问file.csv:

import pandas as pd
frm = pd.read_csv('file.csv', header=None)
Run Code Online (Sandbox Code Playgroud)


小智 5

因此,如果您没有在 google colab 上工作,您只需编写如下内容:

df = pd.read_csv('path_of_the_csv_file')
Run Code Online (Sandbox Code Playgroud)

在 google colab 中,您唯一需要知道的是 csv 文件的路径。

如果您按照我下面写的步骤操作,您的问题将会得到解决:

  1. 首先,将 CSV 文件上传到您的 Google 云端硬盘。
  2. 然后,打开您的 google colab 笔记本并单击页面左侧的“文件”图标。
  3. 然后,单击“Google 云端硬盘文件夹”图标来安装您的 Google 云端硬盘。
  4. 然后,查找您在 Google 云端硬盘上上传的 csv 文件(步骤 1),并复制其路径。
  5. 获得路径后,将其视为普通路径并在代码中使用它。它应该看起来像这样:
   df = pd.read_csv('/content/drive/MyDrive/File.csv')
Run Code Online (Sandbox Code Playgroud)