小编dxb*_*dxb的帖子

有一个大约 6,000,000 行的数据集。我使用以下代码将数据集分为训练集和测试集：

from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.3, random_state=42)

我想要的是将测试集精确地拆分为一定数量的行，例如测试集 50,000 行。

有什么方法可以得到这个？

5
推荐指数

1
解决办法

3022
查看次数

小编dxb_dxb的帖子