我正在尝试加载(人民语音)数据集,但它太大了,有没有办法只下载其中的一部分?
from datasets import load_dataset
from datasets import load_dataset
train = load_dataset("MLCommons/peoples_speech", "clean",split="train[:10%]")
test = load_dataset("MLCommons/peoples_speech", "clean",split="test[:10%]")
Run Code Online (Sandbox Code Playgroud)
使用 ("train [: 10%]") 没有帮助,它仍在尝试下载整个数据集......