小编pyt*_*das的帖子

python中带替换的分层样本

我有一只熊猫DataFrame。我正在尝试创建一个DataFrame带有替换的样本并将其分层。

这允许我替换:

df_test = df.sample(n=100, replace=True, random_state=42, axis=0)
Run Code Online (Sandbox Code Playgroud)

但是,我不确定如何分层。我可以使用该weights参数吗?如果可以,如何使用?我想要分层的列是字符串。

这让我可以分层:

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(
    X, Y, test_size=.50, stratify=Y, random_state=42)
Run Code Online (Sandbox Code Playgroud)

但是,没有选择替换。

如何同时分层和替换?

python random sample sklearn-pandas

4
推荐指数
1
解决办法
1989
查看次数

标签 统计

python ×1

random ×1

sample ×1

sklearn-pandas ×1