如何衡量点击率的统计显着性?

Jac*_*lla 5 ruby statistics

我正在构建一个开源项目,该项目将衡量各种Facebook广告的点击率差异是否显着.从http://adwords.google.com/support/aw/bin/answer.py?hl=zh_CN&answer=167743中获取灵感我编写了以下ruby代码(假设任何未定义的方法完全按照他们的说法执行).

点击率定义为点击广告的人与看到该广告展示的人数相比的百分比.



  # ** exponentiation
  # * multiplication
  # / division
  def standard_deviation
    (experiment_ctr/(control_ctr**3) * (no_of_clicks_for_control +
                                        no_of_clicks_for_experiment - product_of_ctrs *
                                        total_no_of_impressions ) / product_of_impressions) ** 0.5
  end

 def z_score
   (ratio_of_experiment_ctr_to_control - 1) / standard_deviation
  end


我从谷歌网站上复制了标准偏差代码,但对我来说看起来很可疑.有没有人想过这是否正确?

非常感激.

Bre*_*den 2

它看起来并不熟悉,因为它不是大多数人习惯看到的普通显着性检验。大多数显着性检验的公式为(过于笼统,请不要发火):

  1. 计算样本统计量 X
  2. 确定该统计量的预期值 E
  3. 确定该统计量的标准差 S
  4. 计算检验统计量 T = (X - E) / S
  5. 根据 T 的假设分布确定 T 是否显着。

对于常见的均值显着性检验,我们最熟悉的E是样本均值,S是样本标准差。

该显着性检验基于样本统计量的某个比率。Google 提供的 (EC)/C 公式。根据 Google 的说法,该统计数据的预期值为 (1 / (1-p)) - 2,标准差为 (p / ( (C+E) * (1-p)^3 ))^0.5 。所以,这些应该是代入上面 T 公式的数字。Google 解释中的 z 分数。

因此,尽管这个公式看起来很奇怪,但它是基于合理的基础原理的。您应该可以放心使用它。