小编dxb*_*dxb的帖子

将训练/测试拆分为精确的行数

有一个大约 6,000,000 行的数据集。我使用以下代码将数据集分为训练集和测试集:

from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.3, random_state=42)
Run Code Online (Sandbox Code Playgroud)

我想要的是将测试集精确地拆分为一定数量的行,例如测试集 50,000 行。

有什么方法可以得到这个?

python dataframe scikit-learn

5
推荐指数
1
解决办法
3022
查看次数

标签 统计

dataframe ×1

python ×1

scikit-learn ×1