Tom*_*mas 6 python partitioning dataframe python-2.7 pandas
我想将 Pandas DataFrame 划分为十个不相交、大小相同、随机组成的子集。
我知道我可以使用以下方法随机采样原始 Pandas DataFrame 的十分之一:
partition_1 = pandas.DataFrame.sample(frac=(1/10))
Run Code Online (Sandbox Code Playgroud)
但是,我如何获得其他九个分区?如果我再做pandas.DataFrame.sample(frac=(1/10))一次,我的子集可能不会不相交。
谢谢您的帮助!
使用np.random.permutations:
df.loc[np.random.permutation(df.index)]
在您可以将数据帧拆分为 10 个之后,它会打乱数据帧并保留列名称。