上QQ阅读APP看书,第一时间看更新
1.3.2 规律性中的随机性
正如上文提到的,我们在广告后台可能会看到这个关键词近一周的点击率是比较稳定的,请注意是比较稳定,而不是恒定在某个准确的数字。这就是我想告诉你的,规律也会表现出某种随机性。如果我们再抛掷硬币100次,很大可能得到的结果和之前那一次是不一样的。在第一次抛掷硬币试验中,可能有49次正面向上,然而在第二次抛掷硬币试验中可能只有47次正面向上。
不管我们是否再进行一次或一组新的试验,大多数情况下我们并不能得到和上次试验一模一样的数据。这种偏差不仅仅发生于抛掷硬币中,也会发生于调查、试验和其他任何一种数据收集中。比如观察某个信息流广告的创意a的转化率,今天有1000次点击,转化率接近3%;明天还是同样的创意a,还是同样的出价和1000次点击,但转化率可能会相差±1%。
这两个比例之间的差异主要是由于数据本身的随机性引起的。在这种意义上来说,统计学就成了一种研究数据中的偏差问题的手段。
根据作为统计学基础的数学理论,我们可以确定一项调查或试验中的某一比例有多大的随机性,以及在下一次的重复调查或试验中,这个比例可能有多大的偏差。我们甚至可以指出,这两个比例之间的差异,是否大到了随机性本身不能解释的地步,即这一项数据指标已经显著改变了。例如,还记得1.2.1节中提到的A/B测试吗?原始版本的转化率是5.6%,试验版本_1的转化率是6.4%,A/B测试系统会告诉你,转化率是显著优化的,换句话说,相差的0.8个百分点已经大到了随机性本身不能解释的地步。我们将在以后的章节中引申和详细讨论这类问题。