样本的二重性
设
样本具有{随机变量}的性质,{数}的性质
Q:
为什么样本具有二重性 (随机变量与数的性质)?
A: 随机变量:
数: 在确定之后
简单随机样本的要求
统计量有{二重性}(与样本相同的性质)
统计量的本质是{函数
观测值本质是{函数值
常见的统计量
样本均值
样本方差
统计量之间的独立性
一般来说统计量之间{不是}相互独立
Q: 为什么样本方差
系数是
A: 设真实的均值为
这里使用了
例如如果有 3 个数据点, 我们知道了
显然自由度为 2, 而不是 3
需要修改参数, 放大结果, 更贴近实际, 这个系数恰好就是
统计量与数字特征的关系
样本的
样本的
分布 | 形式 | 自由度 | 特性 |
---|---|---|---|
{c1: | |||
{c2: | 分布函数对称 | ||
{c3: |
Q:
A:
自由度
Q: 什么时候使用卡方分布
A: 看到出现正态分布的平方的时候, 多多使用卡方分布
三大分布, 概率密度函数的对称性
卡方分布的数字特征
卡方分布的可加性
随机变量
{
Q: 为什么
A:
分母
这里的
根据大数定律,当
当
因此
所以
{
Q: 为什么
A:
设
{
{
设
Q: 对于来自正态总体的样本,
其样本均值
A: 相互独立
证明比较复杂按下不表
样本方差 相关统计量的分布推导
- 构造卡方分布:
我们知道 ,将其标准化得到 。
根据卡方分布的定义,这 个独立标准正态变量的平方和服从自由度为 的卡方分布:
- 对平方和进行代数分解:
这是最关键的一步,我们对求和项进行变换,引入样本均值 :
展开这个平方项:
我们来分析中间的交叉项:
而 。
所以,交叉项为 0。
分解结果为:
- 两边同除以
:
现在,我们用统计量的符号来重写这个等式:
- 分析等式中各项的分布:
- 等式左边:我们已经知道,
。 - 等式右边第二项:我们刚在第一部分推导出
,所以 。因此,它的平方 。
- 等式左边:我们已经知道,
- 应用 Cochran 定理:
我们有了一个形如 的结构,其中 , 。Cochran 定理告诉我们,等式右边的两项是相互独立的,并且自由度是可加的。
因此,第一项 必须服从卡方分布,其自由度为 。
即 。
T 统计量的分布推导
结论:
推导过程:
这个推导是 t 分布定义的一次完美应用。
-
回顾 t 分布的定义:
,其中 , ,且 独立。 -
寻找 Z 和 U:
根据我们前面的推导:- 令
。我们知道 。 - 令
。我们知道 。这里的自由度 。
- 令
-
检查独立性:
根据关键的 Cochran 定理,样本均值 和样本方差 是相互独立的。因此,由它们构造出的 和 也是相互独立的。 -
代入 t 分布的定义公式:
-
化简表达式:
我们来化简分母:
(因为 S 和 都是标准差,为正数)现在,将化简后的分母代回原式:
-
得出结论:
我们构造的表达式完全符合 t 分布的定义,并且化简后得到了我们想要的目标统计量。其自由度为 的自由度,即 。
因此, 。
这个结果的重大意义在于,构造出的统计量