Khu*_*eed 5 python dataframe pandas sframe
考虑以下代码
one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)
Run Code Online (Sandbox Code Playgroud)
我在这段代码中尝试的是将Sales Sframe中的数据(类似于Pandas DataFrame)随机分成大约4个相等的部分.
什么是Pythonic/Efficient方法来实现这一目标?
np.random.seed(0)
np.random.shuffle(arr) # in-place
sets = np.array_split(arr, 4)
Run Code Online (Sandbox Code Playgroud)