有一个大约 6,000,000 行的数据集。我使用以下代码将数据集分为训练集和测试集:
from sklearn.model_selection import train_test_split
train, test = train_test_split(df, test_size=0.3, random_state=42)
Run Code Online (Sandbox Code Playgroud)
我想要的是将测试集精确地拆分为一定数量的行,例如测试集 50,000 行。
有什么方法可以得到这个?