小编Ris*_*tan的帖子

如何将 parquet 文件从 Azure Blob 读取到 Pandas DataFrame 中?

我需要在本地计算机上将 .parquet 文件读入 Python 中的 Pandas DataFrame,而无需下载文件。parquet 文件存储在具有分层目录结构的 Azure blob 上。我正在做类似以下的事情,但我不知道如何继续:

from azure.storage.blob import BlobServiceClient
blob_service_client = BlobServiceClient.from_connection_string(connection_string)

blob_client = blob_service_client.get_blob_client(container="abc", blob="/xyz/pqr/folder_with_parquet_files")
Run Code Online (Sandbox Code Playgroud)

出于隐私考虑,我在这里使用了虚拟名称。假设目录“folder_with_parquet_files”包含“n”个。parquet 文件,如何将它们读入单个 Pandas DataFrame 中?

azure parquet azure-blob-storage

13
推荐指数
1
解决办法
1万
查看次数

标签 统计

azure ×1

azure-blob-storage ×1

parquet ×1