最大似然估计究竟意味着什么？

Question

当我们训练模型时,我们通常使用MLE来估计模型.我知道这意味着这种学习模型最可能的数据是我们的训练集.但我想知道它的概率是否完全匹配1？

Answer 1

你几乎把它做对了.theta观察数据(X)的模型()的可能性是观察的概率X,给定theta:

L(theta|X) = P(X|theta)

对于最大似然估计(MLE),您可以选择theta提供最大值的值P(X|theta).这并不一定意味着观察到的值X最有可能是MLE的估计值theta.它只是意味着没有其他值theta可以提供更高概率的观测值X.

换句话说,如果T1是MLE估计的theta,并且如果T2是任何其他可能的值theta,那么P(X|T1) > P(X|T2).但是,仍然可能存在Y与观察数据(X)不同的数据()的另一个可能值P(Y|T1) > P(X|T1).

XMLE估计的概率theta不一定是1(并且可能永远不会是除了微不足道的情况).这是预期的,因为X可以采用具有非零概率的多个值.