使用pandas.DataFrame进行概率张量乘法

Ana*_*ory 5 python statistics probability matrix-multiplication pandas

我正在寻找一种在python中存储和使用条件概率的好方法.

我正在考虑使用pandas数据帧.如果某些条件概率X的P(X=A|P1=1, P2=1) = 0.2,P(X=B|P1=2, P2=1) = 0.9等等,我会使用数据框

         A    B
P1 P2          
1  1   0.2  0.8
   2   0.5  0.5
2  1   0.9  0.1
   2   0.9  0.1

Run Code Online (Sandbox Code Playgroud)

并给予的边缘概率P1和P2系列作为

1    0.4
2    0.6
Name: P1

1    0.7
2    0.3
Name: P2

Run Code Online (Sandbox Code Playgroud)

我想获得系列的边际概率X,即系列

A    0.602
B    0.398
Name: X

Run Code Online (Sandbox Code Playgroud)

我可以得到我想要的东西

X = sum(
    sum(
        X.xs(i, level="P1")*P1[i]
        for i in P1.index
        ).xs(j)*P2[j]
    for j in P2.index
    )
X.name="X"

Run Code Online (Sandbox Code Playgroud)

但这是不容易推广到更多的依赖关系,首先之间的不对称xs与level和第二个没有看起来奇怪和往常一样工作时pandas,我非常肯定存在使用它的技巧和方法,更好的解决方案.

pandas如果我以另一种方式表示我的数据,那么这是一个很好的工具,这个计算的最佳方法是什么,它本质上是一个索引张量积pandas？

归档时间：	13 年，2 月前
查看次数：	749 次
最近记录：	13 年，2 月前

减少绘图滴答数 137

本地Flask服务器上的慢速请求 74

为什么Python easy_install无法在我的Mac上运行？ 59

使用MultiIndex的Pandas数据框:检查字符串是否包含在索引级别中 7

UnicodeDecodeError：'charmap'编解码器无法解码位置7240中的字节0x8d：字符映射为<undefined> 6

pandas multi-index如何通过二级掩盖数据 6

用数据框 Python pandas 中的空白替换 0 6

从 Meshgrid 重塑 Pandas DataFrame 5

如何在python pandas中使用带有bool的查询功能？ 5

优化 for 循环 RcppArmadillo 中的矩阵乘法 0

Python有一个字符串'contains'子串方法吗？ 3601

如何使用jQuery刷新页面？ 2361

#include <filename>和#include"filename"有什么区别？ 2204

如何使用Git将标签推送到远程存储库？ 2091

如何确定变量是"未定义"还是"空"？ 2000

如何检查字符串"StartsWith"是否是另一个字符串？ 1660

我怎样才能找到带有Mathematica的Waldo？ 1538

Android中的gravity和layout_gravity有什么区别？ 1286

如何使用Sublime Text 2重新格式化HTML代码？ 1282

返回IEnumerable <T>与IQueryable <T> 1051