小编FOX*_*SDF的帖子

有没有一种方法可以让我只从 Huggingface 下载数据集的一部分？

我正在尝试加载（人民语音）数据集，但它太大了，有没有办法只下载其中的一部分？

from datasets import load_dataset

from datasets import load_dataset

train = load_dataset("MLCommons/peoples_speech", "clean",split="train[:10%]")
test = load_dataset("MLCommons/peoples_speech", "clean",split="test[:10%]")

Run Code Online (Sandbox Code Playgroud)

使用 ("train [: 10%]") 没有帮助，它仍在尝试下载整个数据集......

dataset huggingface-datasets huggingface

FOX*_*SDF

lucky-day

6
推荐指数

1
解决办法

852
查看次数

标签统计

dataset ×1

huggingface ×1

huggingface-datasets ×1

有没有一种方法可以让我只从 Huggingface 下载数据集的一部分？

标签 统计

小编FOX_SDF的帖子

标签统计