我已经查看了Sklearn分层抽样文档以及大熊猫文档以及来自Pandas的分层样本和基于列的sklearn分层抽样,但他们没有解决这个问题.
我正在寻找一种快速的pandas/sklearn/numpy方法,从数据集中生成大小为n的分层样本.但是,对于小于指定采样数的行,它应该采用所有条目.
具体例子:
谢谢!:)
python numpy pandas scikit-learn
numpy ×1
pandas ×1
python ×1
scikit-learn ×1