che*_*000 6 python csv dataframe pandas
import pandas as pd
df = pd.read_csv("train.csv")
sample = df.sample(10)
sample.to_csv("train_subset.csv")
Run Code Online (Sandbox Code Playgroud)
我想从给定的 csv 文件 (train.csv) 中随机抽取 10 行并将其存储为新的 csv 文件 train_subset.csv。上面的代码就实现了这一点。现在我还想将所有未采样的行存储到文件 train_remaining.csv 中。
我怎样才能实现它?如何找到对哪些行进行了采样?
我建议使用sklearns train_test_split。
http://scikit-learn.org/stable/modules/ generated/sklearn.model_selection.train_test_split.html
这将允许您获取随机选择的行的一定百分比。
| 归档时间: |
|
| 查看次数: |
2197 次 |
| 最近记录: |