小编har*_*lli的帖子

是否有任何命令可以使用 kaggle API 从 Kaggle Competition 的特定文件夹下载数据

我正在尝试从 Kaggle Competition state-farm-distracted-driver-detection下载数据

数据集具有以下目录结构

|-driver_imgs_list.csv
|-sample-submission.csv
|imgs
|   |test
|   |train
|       |c0
|       |c1
|       |c2
|          |-img_100029.jpg
|          |-img_100108.jpg
Run Code Online (Sandbox Code Playgroud)

我只想下载 imgs/train/c2 文件夹。我知道如何下载完整数据集和特定文件,但我无法弄清楚如何使用 API 下载特定文件夹

最初我尝试使用 Kaggle CLI API,使用它我可以下载特定的图像如下

kaggle competitions download state-farm-distracted-driver-detection -f imgs/train/c2/img_100029.jpg
Run Code Online (Sandbox Code Playgroud)

但是,当我尝试使用以下命令下载 c2 文件夹时,出现类似 File not found 的错误

kaggle competitions download state-farm-distracted-driver-detection -f imgs/train/c2
404 - Not Found
Run Code Online (Sandbox Code Playgroud)

是否有任何命令可以从 kaggle api 的竞赛中下载特定文件夹?

作为另一个试验,我使用 python 中的 Kaggle API 下载该文件夹

我的想法是,有一个名为“driver_imgs_list.csv”的文件,其中包含诸如 (c0,c1,c2..) 之类的类名及其相应的图像文件。因为我想下载 c2 类文件夹,所以我使用 Pandas 将 c2 类图像文件存储在一个数组中。然后我尝试使用 for 循环下载每个文件,如下所示

from kaggle.api.kaggle_api_extended import KaggleApi …
Run Code Online (Sandbox Code Playgroud)

python api dataset kaggle

7
推荐指数
1
解决办法
1710
查看次数

标签 统计

api ×1

dataset ×1

kaggle ×1

python ×1