在Python中有效地分割数据

Khu*_*eed 5 python dataframe pandas sframe

考虑以下代码

one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)
Run Code Online (Sandbox Code Playgroud)

我在这段代码中尝试的是将Sales Sframe中的数据(类似于Pandas DataFrame)随机分成大约4个相等的部分.

什么是Pythonic/Efficient方法来实现这一目标?

Joh*_*nck 2

np.random.seed(0)
np.random.shuffle(arr) # in-place
sets = np.array_split(arr, 4)
Run Code Online (Sandbox Code Playgroud)