Pandas Dataframe 示例的补充

che*_*000 6 python csv dataframe pandas

import pandas as pd

df = pd.read_csv("train.csv")

sample = df.sample(10)

sample.to_csv("train_subset.csv")
Run Code Online (Sandbox Code Playgroud)

我想从给定的 csv 文件 (train.csv) 中随机抽取 10 行并将其存储为新的 csv 文件 train_subset.csv。上面的代码就实现了这一点。现在我还想将所有未采样的行存储到文件 train_remaining.csv 中。

我怎样才能实现它?如何找到对哪些行进行了采样?

Gre*_*reg 1

我建议使用sklearns train_test_split。

http://scikit-learn.org/stable/modules/ generated/sklearn.model_selection.train_test_split.html

这将允许您获取随机选择的行的一定百分比。