我有类似的东西
df = pd.DataFrame(np.random.randint(2, 10, size = (5, 2)))
df.index = pd.MultiIndex.from_tuples([(1, 'A'), (2, 'A'), (4, 'B'),
(5, 'B'), (8, 'B')])
df.index.names = ['foo', 'bar']
df.columns = ['count1', 'count2']
df
Run Code Online (Sandbox Code Playgroud)
这使:
count1 count2
foo bar
1 A 6 7
2 A 2 9
4 B 6 7
5 B 4 6
8 B 5 6
Run Code Online (Sandbox Code Playgroud)
我还有一个总计列表 - 从其他地方获得 - 通过相同的'foo'索引:
totals = pd.DataFrame([2., 1., 1., 1., 10.])
totals.index = [1, 2, 4, 5, 8]
totals.index.names = ['foo']
totals
Run Code Online (Sandbox Code Playgroud)
这使:
0
foo
1 2
2 1
4 1
5 1
8 10
Run Code Online (Sandbox Code Playgroud)
如何将df(count1和count2)的所有列除以总计中的foo数?(因此,我需要匹配'foo'号码)
我检查了这个问题,看起来应该这样做,但我无法理解.
我试过了
df.div(totals, axis = 0)
Run Code Online (Sandbox Code Playgroud)
并更改div中的级别选项,但没有成功.
一如既往,非常感谢您的时间
尝试:
df.div(totals[0],axis='index',level='foo')
count1 count2
foo bar
1 A 1.0 4.5
2 A 4.0 8.0
4 B 5.0 9.0
5 B 5.0 5.0
8 B 0.9 0.5
Run Code Online (Sandbox Code Playgroud)
还:
totals = pd.DataFrame([2., 1., 1., 1., 10.])
totals.index = [[1, 2, 4, 5, 8],['A', 'A', 'B', 'A', 'B']]
totals.index.names = ['foo','bar']
totals
0
foo bar
1 A 2.0
2 A 1.0
4 B 1.0
5 A 1.0
8 B 10.0
df[['count1','count2']].div(totals[0],axis='index')
count1 count2
foo bar
1 A 1.0 4.5
2 A 4.0 8.0
4 B 5.0 9.0
5 A NaN NaN
B NaN NaN
8 B 0.9 0.5
Run Code Online (Sandbox Code Playgroud)
使用作品values列表totals[0]:
df.div(totals[0].values, axis=0)
Run Code Online (Sandbox Code Playgroud)
但它没有考虑索引totals。不知道为什么这不起作用:
df.div(totals[0], level=0, axis=0)
Run Code Online (Sandbox Code Playgroud)