如何在Python中绘制最大似然估计值

5 python statistics numpy machine-learning

我正在从指数分布中抽取一些样本.在我的第一个实验中,我正在绘制1000个样本,而在第二个实验中,我正在从这个分布中抽取10,000个样本.(使用numpy.random.exponential)

我想直观地比较两次实验的最大似然估计的差异.(因为这是指数分布,MLE将只是样本均值,所以在我的第二个实验中,MLE应该更接近真实密度).

我怎样才能在Python中进行这样的比较?我知道如何在matplotlib中绘制图形,但在这里我不知道应该使用什么类型的图形.

aha*_*ans 4

鉴于评论中的评论,我想您正在寻找类似以下内容:

import numpy as np
import matplotlib.pyplot as plt

def plot_exponential_density(mu, xmax, fmt, label):
        x = np.arange(0, xmax, 0.1)
        y = 1/mu * np.exp(-x/mu)
        plt.plot(x, y, fmt, label=label)

def sample_and_plot(N, color):
        # first sample N valus
        samples = np.zeros( (N,1) )
        for i in range(0,N):
                samples[i] = np.random.exponential()

        # determine the mean
        mu = np.mean(samples)
        print("N = %d  ==> mu = %f" % (N, mu))

        # plot a histogram of the samples
        (n, bins) = np.histogram(samples, bins=int(np.sqrt(N)), density=True)
        plt.step(bins[:-1], n, color=color, label="samples N = %d" % N)

        xmax = max(bins)

        # plot the density according to the estimated mean
        plot_exponential_density(mu, xmax, color + "--", label="estimated density N = %d" % N)

        return xmax


# sample 100 values, draw a histogram, and the density according to
# the estimated mean
xmax1 = sample_and_plot(100, 'r')
# do the same for 1000 samples
xmax2 = sample_and_plot(10000, 'b')

# finally plot the true density
plot_exponential_density(1, max(xmax1, xmax2), 'k', "true density")

# add a legend
plt.legend()

# and show the plot
plt.show()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

我使用了 100 和 10,000 个样本,因为有了 1,000 个样本,估计值就已经相当不错了。但仍然只有 100 个样本,我对平均值以及密度的估计如此之好感到有些惊讶。仅给出直方图,而不知道样本是从指数分布中抽取的,我不确定我是否会在这里识别指数分布......