我试图找到/找出一个可以更新概率的函数。
假设有三个玩家,他们每个人都从篮子里得到一个水果: ["apple", "orange", "banana"]
我将每个玩家拥有每个水果的概率存储在一个矩阵中(如这张表):
| 苹果 | 橘子 | 香蕉 | |
|---|---|---|---|
| 玩家 1 | 0.3333 | 0.3333 | 0.3333 |
| 玩家 2 | 0.3333 | 0.3333 | 0.3333 |
| 玩家 3 | 0.3333 | 0.3333 | 0.3333 |
该表可以解释为不知道谁拥有什么的人 ( S )的信念。每行和每列的总和为 1.0,因为每个玩家都有一个水果,每个水果都属于其中一个玩家。
我想根据S获得的一些知识更新这些概率。示例信息:
玩家 1做了 X。我们知道玩家 1有 80% 的概率做了 X,如果他有一个苹果。如果他有橙子,则为 50% 。如果他有香蕉,则为 10% 。
这可以写得更简洁[0.8, 0.5, 0.1],让我们称之为reach_probability。
一个相当容易理解的例子是:
probabilities = [
[0.5, 0.5, 0.0],
[0.0, 0.5, 0.5],
[0.5, 0.0, 0.5],
]
# Player 1's
reach_probability = [1.0, 0.0, …Run Code Online (Sandbox Code Playgroud)