频率学派通过观察数据来确定背后的概率分布。
统计学中一个主要的问题是估计参数。我们用一个取值为样本的函数来估计我们感兴趣的参数,并称这个函数为估计量。这里我们用一个估计圆周率\(\pi\)的例子来具体说明这个想法。 我们知道\(\pi\)可以由圆与其外切正方形的面积比来表示: $$\begin{matrix}S_{circle} = \pi r^2\\S_{square} = 4r^2\end{matrix} \implies \pi = 4 \frac{S_{circle}}{S_{square}}$$ 首先我们均匀地在正方形上随机生成\(n\)个样本,用\(m\)来表示落入这个正方形内切圆的样本个数。定义估计量\(\hat{\pi}\)如下: $$\hat{\pi} = 4\dfrac{m}{n}$$ 我们可以看到这个估计量有良好的性质:无偏性 和相合性。
\( m= \) 0.00 \( n= \) 0.00 |
\( \hat{\pi}= \) |
与点估计不同,置信区间用估计的是一个参数的范围。一个置信区间对应着一个置信水平:一个置信水平为\(95\%\)的置信区间表示这个置信区间包含了真实参数的频率为\(95\%\)。
你可以选择一个概率分布来生成样本
选择样本大小\(n\)和置信水平 \((1-\alpha)\)。
开始生成样本和构造置信区间。