博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
利用统计计算而不是计算机模拟解决样本容量问题
阅读量:5960 次
发布时间:2019-06-19

本文共 543 字,大约阅读时间需要 1 分钟。

微信群的小伙伴提了一个有意思的问题:

然后他用 R 模拟了一下,大约 150次左右。

但是我想用统计学的方法直接计算结果。

二项分布的正态近似

抛硬币问题是一个典型的二项分布问题。按题目,抛 n 次硬币头朝上的概率为:

P(\eta = k) = C_n^kp^k(1-p)^{n-k}

当满足 np\ge5n(1-p)\ge5 时,二项分布可以近似为 \mu = np,\delta = \sqrt{np(1-p)}的正态分布。

那么在上题中,只要抛 A 硬币的次数大于等于13次,抛 B 硬币的次数大于等于10次,那么抛硬币的二项分布就可以近似为正态分布。

两总体均值推断

硬币 A 虽然被动过手脚,但是对于不知情的人来说,硬币 A、B 头朝上的概率 p都应该是 0.5。所以对于不知情的人,多次抛掷硬币 A 或 B 的组成的样本都应该服从 \mu = 0.5n,\delta = \sqrt{0.25n}的正态分布。

同时,多次抛掷硬币 A 或 B 这一过程的结果可以视为该正态分布的一个简单随机样本。

因此,不知情的投币人如果怀疑每次抛掷 A,B 硬币头朝上的概率不同,则可以提出假设:

H_0:p_a=p_b
H_a:p_a\neq p_b

抛掷硬币 A,B 这两个实验的比例之差点估计量为:

\bar{p_a}-\bar{p_b}

\bar{p_a}-\bar{p_b}的标准误差为:

\delta_{\bar{p_a}-\bar{p_b}} = \sqrt{\frac{p_a(1-p_a)}{n_a}+\frac{p_a(1-p_b)}{n_b}}

在假设H_0为真时,p_a = p_b = p,p_a-p_b 的标准误差变为:

\delta_{\bar{p_a}-\bar{p_b}} = \sqrt{\frac{p(1-p)}{n_a}+\frac{p(1-p)}{n_b}} = \sqrt{p(1-p)(\frac{1}{n_a}+\frac{1}{n_b})}

所以检验统计量

z = \frac{\bar{p_a}-\bar{p_b}}{\delta_{\bar{p_a}-\bar{p_b}}} = \frac{0.1}{\sqrt{0.25(\frac{1}{n_a}+\frac{1}{n_b})}}

回到题目

题目里要求的95%的置信度确认 A,B 不同,那么95%的置信度即要求检验统计量 Z \le1.96。解出来 \frac{1}{n_a}+\frac{1}{n_b} \le 0.2。如果要求抛掷 A,B 的次数相同,则各抛200次即可。和计算机模拟的次数相差似乎还在可接收范围内。

转载地址:http://fzfax.baihongyu.com/

你可能感兴趣的文章
PHP学习1——快速入门
查看>>
面试发散思维
查看>>
java日志commons-logging/log4j/slf4j/logBack需要知道的几件事
查看>>
TypeScript 2019 路线图:更效率,更易用!
查看>>
Springboot从HellWorld开始
查看>>
Apache uimaFIT 3.0.0 发布,Java 的 UIMA 注解类
查看>>
用js来实现那些数据结构15(图01)
查看>>
web前端学习:React是什么,为什么要使用它?
查看>>
常见排序算法及对应的时间复杂度和空间复杂度
查看>>
业界 | 在德州叫一辆自动驾驶车,Drive.ai安排了7辆无人车展开真实试验
查看>>
实时数据平台设计:解决从OLTP到OLAP实时流转缺失
查看>>
三家公司在SD-WAN方面的新动作
查看>>
C#在PDF中如何以不同颜色高亮文本
查看>>
在同一页面显示多个JavaScript统计图表
查看>>
Mac电脑Tomcat下载及安装(详细)MAC在Eclipse里配置tomcat
查看>>
多线程之-----------定时器
查看>>
C#语法——反射,架构师的入门基础。
查看>>
Beego Models 之 一
查看>>
Python购物车练习
查看>>
StringBuffer 和 StringBiulder的区别
查看>>