我有一个列表,每个条目都是公司名称
companies = ['AA', 'AAPL', 'BA', ....., 'YHOO']
Run Code Online (Sandbox Code Playgroud)
我想为列表中的每个条目创建一个新的数据帧.
就像是
(伪代码)
for c in companies:
c = pd.DataFrame()
Run Code Online (Sandbox Code Playgroud)
我已经找到了一种方法来做到这一点,但找不到它.有任何想法吗?
我想通过分层采样将 Dataframe 分成 4 部分。确保“B”列中的所有类别都应出现在每个块中。如果任何类别没有足够的记录用于所有块,请将相同的记录复制到剩余的块中。
df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo',
'foo', 'bar', 'foo', 'bar',
'foo', 'bar', 'foo', 'foo', 'bar'],
'B' : ['one', 'one', 'two', 'three',
'two', 'two', 'one', 'three',
'one', 'one', 'two', 'three',
'two', 'two', 'one', 'three', 'four'],
'C' : np.random.randn(17), 'D' : np.random.randn(17)})
print(df)
A B C D
0 foo one 0.960627 0.318723
1 bar one 0.269439 -0.945565
2 foo two 0.210376 0.765680
3 bar three -0.375095 -1.617334
4 foo two -1.910716 …Run Code Online (Sandbox Code Playgroud)