我有一个不平衡的数据集,想对代表性过高的类进行不足采样。我该怎么做。我想使用 weightedrandomsampler 但我也愿意接受其他建议。
到目前为止,我假设我的代码必须具有如下结构。但我不知道如何精确地做到这一点。
trainset = datasets.ImageFolder(path_train,transform=transform)
...
sampler = data.WeightedRandomSampler(weights=..., num_samples=..., replacement=...)
...
trainloader = data.DataLoader(trainset, batchsize = batchsize, sampler=sampler)
我希望有人能帮帮忙。非常感谢
neural-network conv-neural-network pytorch imbalanced-data cnn