确定随机变量的概率质量函数

Sky*_*eSM 5 matlab probability discrete-space

如果我们在X(n)中有一个离散的随机变量x和与之相关的数据,我们如何在matlab中确定概率质量函数pmf(X)?

Amr*_*mro 5

您可以通过至少八种不同的方式执行此操作(其中一些已在其他解决方案中提及).

假设我们有一个离散随机变量的样本:

X = randi([-9 9], [100 1]);
Run Code Online (Sandbox Code Playgroud)

考虑这些等效的解决方案(请注意,我不假设任何有关可能值的范围,只是它们是整数):

[V,~,labels] = grp2idx(X);
mx = max(V);

%# TABULATE (internally uses HIST)
t = tabulate(V);
pmf1 = t(:, 3) ./ 100;

%# HIST (internally uses HISTC)
pmf2 = hist(V, mx)' ./ numel(V);                      %#'

%# HISTC
pmf3 = histc(V, 1:mx) ./ numel(V);

%# ACCUMARRAY
pmf4 = accumarray(V, 1) ./ numel(V);

%# SORT/FIND/DIFF
pmf5 = diff( find( [diff([0;sort(V)]) ; 1] ) ) ./ numel(V);

%# SORT/UNIQUE/DIFF
[~,idx] = unique( sort(V) );
pmf6 = diff([0;idx]) ./ numel(V);

%# ARRAYFUN
pmf7 = arrayfun(@(x) sum(V==x), 1:mx)' ./ numel(V);   %#'

%# BSXFUN
pmf8 = sum( bsxfun(@eq, V, 1:mx) )' ./ numel(V);      %#'
Run Code Online (Sandbox Code Playgroud)

请注意,GRP2IDX用于获取从1开始的索引,对应于pmf(映射由下面给出labels)的条目.以上结果是:

>> [labels pmf]
ans =
           -9         0.03
           -8         0.07
           -7         0.04
           -6         0.07
           -5         0.03
           -4         0.06
           -3         0.05
           -2         0.05
           -1         0.06
            0         0.05
            1         0.04
            2         0.07
            3         0.03
            4         0.09
            5         0.08
            6         0.02
            7         0.03
            8         0.08
            9         0.05
Run Code Online (Sandbox Code Playgroud)