【频数的样本方差公式】在统计学中,样本方差是衡量一组数据与其平均值之间差异程度的重要指标。当数据以频数形式出现时(即某些数值出现的次数),计算其样本方差的方法与普通数据略有不同。本文将总结频数的样本方差公式,并通过表格形式展示相关计算步骤。
一、基本概念
- 频数:指某一数值在数据集中出现的次数。
- 样本方差:衡量一组数据相对于其均值的离散程度,用于估计总体方差。
二、频数的样本方差公式
当数据以频数形式表示时,样本方差的计算公式为:
$$
s^2 = \frac{1}{n - 1} \sum_{i=1}^{k} f_i (x_i - \bar{x})^2
$$
其中:
- $ s^2 $:样本方差
- $ n $:总样本数(即所有频数之和)
- $ k $:不同数值的个数
- $ f_i $:第 $ i $ 个数值的频数
- $ x_i $:第 $ i $ 个数值
- $ \bar{x} $:样本均值
而样本均值 $ \bar{x} $ 的计算公式为:
$$
\bar{x} = \frac{\sum_{i=1}^{k} f_i x_i}{n}
$$
三、计算步骤(以表格形式展示)
数值 $ x_i $ | 频数 $ f_i $ | $ f_i x_i $ | $ x_i - \bar{x} $ | $ (x_i - \bar{x})^2 $ | $ f_i (x_i - \bar{x})^2 $ |
$ x_1 $ | $ f_1 $ | $ f_1 x_1 $ | $ x_1 - \bar{x} $ | $ (x_1 - \bar{x})^2 $ | $ f_1 (x_1 - \bar{x})^2 $ |
$ x_2 $ | $ f_2 $ | $ f_2 x_2 $ | $ x_2 - \bar{x} $ | $ (x_2 - \bar{x})^2 $ | $ f_2 (x_2 - \bar{x})^2 $ |
... | ... | ... | ... | ... | ... |
$ x_k $ | $ f_k $ | $ f_k x_k $ | $ x_k - \bar{x} $ | $ (x_k - \bar{x})^2 $ | $ f_k (x_k - \bar{x})^2 $ |
总和
四、示例说明
假设有一组数据如下:
数值 $ x_i $ | 频数 $ f_i $ |
10 | 2 |
15 | 3 |
20 | 5 |
计算过程如下:
1. 计算总样本数 $ n = 2 + 3 + 5 = 10 $
2. 计算均值:
$$
\bar{x} = \frac{2 \times 10 + 3 \times 15 + 5 \times 20}{10} = \frac{20 + 45 + 100}{10} = \frac{165}{10} = 16.5
$$
3. 计算每个项的 $ (x_i - \bar{x})^2 $ 及其乘积 $ f_i (x_i - \bar{x})^2 $
数值 $ x_i $ | 频数 $ f_i $ | $ f_i x_i $ | $ x_i - \bar{x} $ | $ (x_i - \bar{x})^2 $ | $ f_i (x_i - \bar{x})^2 $ |
10 | 2 | 20 | -6.5 | 42.25 | 84.5 |
15 | 3 | 45 | -1.5 | 2.25 | 6.75 |
20 | 5 | 100 | 3.5 | 12.25 | 61.25 |
总计 | 10 | 165 | — | — | 152.5 |
4. 计算样本方差:
$$
s^2 = \frac{152.5}{10 - 1} = \frac{152.5}{9} \approx 16.94
$$
五、总结
频数的样本方差公式适用于以频数形式呈现的数据集。计算过程中需要先求出样本均值,再逐项计算偏差平方与频数的乘积,最后求和并除以 $ n - 1 $ 得到样本方差。通过表格形式可以清晰地展示每一步计算结果,有助于理解和验证计算过程。