如何在Google Cloud Platform jupyter笔记本中读取csv文件

use*_*102 1 google-cloud-platform jupyter-notebook

我正在谷歌云平台AI笔记本中的Jupyter笔记本上工作。现在我想读取 GCP 中的 .csv 文件,该文件存储在我的笔记本电脑本地。

我的做法:

df = pd.read_csv("C:\Users\Desktop\New Folder\Data.csv")

但它不起作用。如何在GCP AI笔记本中读取本地文件。

ch_*_*ike 5

我认为没有直接的方法可以做到这一点,但这里有三种选择:

a) 从 Jupyter UI 上传文件:

1.打开Jupyter UI。

2. 在屏幕左窗格中顶部菜单下方,单击 按钮"Upload files"

3.从本地文件系统中选择文件,然后单击“打开”。

4. 文件出现在屏幕左侧窗格中后,右键单击该文件并选择"Copy Path"

5.在您的笔记本中,键入以下代码,替换test.csv为您刚刚复制的路径:

import pandas as pd    
df2 = pd.read_csv("test.csv")
print(df2)
Run Code Online (Sandbox Code Playgroud)

b. 将文件上传到 Notebooks 实例的文件系统

1.转到GCP 控制台中的计算引擎屏幕。

2.使用 按钮通过 SSH 连接到您的 AI Platform Notebooks 实例SSH

3.在新的终端窗口中,单击齿轮图标和"Upload File"选项

4.从本地文件系统中选择文件,然后单击“打开”。

5.该文件将存储在$HOME/中,可以选择将其移动到所需的路径。

6.在您的笔记本中,键入以下代码,并相应地替换路径:

import pandas as pd
df = pd.read_csv("/path/to_file/test.csv")
print(df2)
Run Code Online (Sandbox Code Playgroud)

c)将文件存储在GCS存储桶中。

1.将您的文件上传到GCS

2.在您的笔记本中,键入以下代码,并相应地替换存储桶和文件名:

import pandas as pd
from google.cloud import storage
from io import BytesIO
client = storage.Client()
bucket_name = "your-bucket"
file_name = "your_file.csv"
bucket = client.get_bucket(bucket_name)
blob = bucket.get_blob(file_name)
content = blob.download_as_string()
df = pd.read_csv(BytesIO(content))
print(df)
Run Code Online (Sandbox Code Playgroud)