小编FOX*_*SDF的帖子

有没有一种方法可以让我只从 Huggingface 下载数据集的一部分?

我正在尝试加载(人民语音)数据集,但它太大了,有没有办法只下载其中的一部分?

from datasets import load_dataset

from datasets import load_dataset

train = load_dataset("MLCommons/peoples_speech", "clean",split="train[:10%]")
test = load_dataset("MLCommons/peoples_speech", "clean",split="test[:10%]")
Run Code Online (Sandbox Code Playgroud)

使用 ("train [: 10%]") 没有帮助,它仍在尝试下载整个数据集......

dataset huggingface-datasets huggingface

6
推荐指数
1
解决办法
852
查看次数