置信

A/B测试算法大揭秘第四篇:置信区间究竟是怎么来的?

置信区间的概念置信区间(Confidence Interval)是用来对一个概率样本的总体参数进行区间估计的样本均值范围,它展现了这个均值范围包含总体参数的概率,这个概率称为置信水平。置信水平代表了估计的可靠度,一般而言,我们采用 95% 的置信水平进行区间估计。置信区间的计算方法根据统计学的中心极限定理,样本均值的抽样分布呈正态分布。由之前介绍的t检验大样本检验公式计算得

基于统计思想下的推荐系统

基于统计思想下的推荐系统是什么样的?文章为你揭开迷雾。我们先做如下设定:每个用户的打分都是独立事件。用户只有两个选择,要么投喜欢’1’,要么投不喜欢’0’。如果总人数为n,其中喜欢的为k,那么喜欢的比例p就等于k/n。这是一种统计分布,叫做”二项分布”(binomial distribution)理论上讲,p越大应该越好,但是n的不同,导致p的可信性有差异。100个人投票,