从双变量高斯分布生成均值

sig*_*ker 4 statistics r machine-learning gaussian

我正在阅读ESLII统计学习元素,在第2章中,他们有一个高斯混合数据集来说明一些学习算法.为了生成该数据集,它们首先从双变量高斯分布N((1,0)',I)生成10个均值.我不确定他们是什么意思?

如何从具有均值(1,0)的双变量分布中生成10个均值?

awe*_*omo 6

从双变量高斯分布生成的每个均值是简单的单点,其采样方式与可从分布生成的任何其他随机点完全相同.他们使用这些生成的点作为新分布的手段的事实是无关紧要的.

假设10个均值中的每一个都用于构造新的双变量高斯.

表示~N((1,0),I)

其中表示从分布中提取的值.由于在这种情况下从中采样的分布是双变量高斯,所以采样的每个数据点将是2维点(x1,y1).

然后可以使用从原始分布中采样的这些点中的每一个来进行新的分布.

例:

means = [ (x1,y1), (x2,y2), ..., (x10,y10) ]
Run Code Online (Sandbox Code Playgroud)

建立新的双变量高斯:

N1((x1,x2), I), N2((x2,y2), I), ..., N10((x10,y10), I)
Run Code Online (Sandbox Code Playgroud)

他们只是使用初始的双变量高斯分布N((1,0),I)作为一种简单的方法来挑选10个正态分布的随机方法.