微信群的小伙伴提了一个有意思的问题:
然后他用 R 模拟了一下,大约 150次左右。
但是我想用统计学的方法直接计算结果。
二项分布的正态近似
抛硬币问题是一个典型的二项分布问题。按题目,抛 次硬币头朝上的概率为:
当满足 且 时,二项分布可以近似为 的正态分布。
那么在上题中,只要抛 A 硬币的次数大于等于13次,抛 B 硬币的次数大于等于10次,那么抛硬币的二项分布就可以近似为正态分布。
两总体均值推断
硬币 A 虽然被动过手脚,但是对于不知情的人来说,硬币 A、B 头朝上的概率 都应该是 0.5。所以对于不知情的人,多次抛掷硬币 A 或 B 的组成的样本都应该服从 的正态分布。
同时,多次抛掷硬币 A 或 B 这一过程的结果可以视为该正态分布的一个简单随机样本。
因此,不知情的投币人如果怀疑每次抛掷 A,B 硬币头朝上的概率不同,则可以提出假设:
抛掷硬币 A,B 这两个实验的比例之差点估计量为:
的标准误差为:
在假设为真时,, 的标准误差变为:
所以检验统计量
回到题目
题目里要求的95%的置信度确认 A,B 不同,那么95%的置信度即要求检验统计量 。解出来 。如果要求抛掷 A,B 的次数相同,则各抛200次即可。和计算机模拟的次数相差似乎还在可接收范围内。