我有一只熊猫DataFrame。我正在尝试创建一个DataFrame带有替换的样本并将其分层。
这允许我替换:
df_test = df.sample(n=100, replace=True, random_state=42, axis=0)
Run Code Online (Sandbox Code Playgroud)
但是,我不确定如何分层。我可以使用该weights参数吗?如果可以,如何使用?我想要分层的列是字符串。
这让我可以分层:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
X, Y, test_size=.50, stratify=Y, random_state=42)
Run Code Online (Sandbox Code Playgroud)
但是,没有选择替换。
如何同时分层和替换?