地位量数(下)—中位数、众数
880 次检阅

连结:地位量数(上)—平均数

本篇接续介绍中位数及众数两种地位量数。中位数与众数均不受太大或太小的观测值(又称极端值)影响,因此又称为稳健 (robust) 地位量数。

1. 中位数 (median): 将资料由小排到大,找出位于中间项的数值(当样本数个数为奇数)或中间两项之平均值(样本数个数为偶数), 举例来说,有 \(n\) 笔资料由小排到大,排名第 \(k\) 的资料记为 \(x_{(k)}\),可得 \(x_{(1)}\le x_{(2)}\le … \le x_{(n)}\),则中位数为:

\(M=\left\{\begin{array}{ll}x_{(\frac{n+1}{2})} & \text{, if } n \text{ is an odd number} \\\frac{1}{2}[x_{(\frac{n}{2})}+x_{(\frac{n+2}{2})}] & \text{,if } n \text{ is an even number} \\\end{array}\right.\)

例: \(15\) 位打靶者,每人有 \(13\) 发子弹,其中靶的次数如下:

\(13, 1, 5, 6, 7, 8, 4, 5, 6, 7, 8, 11, 12, 6, 8\)

求 \(15\) 位同学中靶次数的中位数。

解:将 \(15\) 位同学中靶次数由小至大排序结果如下

\(1, 4, 5, 5, 6, 6, 6, 7, 7, 8, 8, 8, 11, 12, 13\)

由于样本大小 \(n = 15\) 为奇数,中位数为排名第 \((15+1) / 2 = 8\) 的数值,\(x_{(8)}=7=M\)。

若欲计算已分组资料的中位数,且假设各组次数均匀的分布在该组内时,则中位数计算公式为

\(\displaystyle M=L_M+\left(\frac{n}{2}-F_{L_M}\right)\times \frac{h_M}{f_M}\)

\(L_M\):中位数所在的组之下界\(F_{L_M}\):累积至 \(L_M\) 的个数\(h_M\):中位数所在组的组距\(f_M\):中位数所在组的个数。

例: 表三为已分为五组之样本,样本大小为 \(30\),可知中位数的位置在由小排到大之第 \(15\) 及第 \(16\) 数字中间,将次数累加可知,中位数会落在 69.5-79.5 那组,因此

\(\displaystyle M=L_M+\left(\frac{n}{2}-F_{L_M}\right)\times \frac{h_M}{f_M}=69.5+(\frac{30}{2}-8)\times\frac{10}{12}=75.33\)

表三、已分组资料中位数计算範例。(本文作者蓝翊文製)

组界组中点 (x)

(自行计算)次数 (f)组中点\(\times\)次数

(自行计算)49.5-59.554.5210959.5-69.564.5638769.5-79.574.51289479.5-89.584.57591.589.5-99.594.53283.5302265

2. 众数 (mode) 的定义为资料当中出现频率最多的数值,因此,众数不一定唯一(可以有多个)。

A. 未分组资料

例: 一班级进行投篮比赛,派出 \(10\) 位同学,每人投 \(10\) 个球,进球数如下,求众数。

\(4, 4, 7, 5, 2, 7, 8, 7, 4, 3\)

解:计算进球数出现的频率分别如下表:

表四、进球数频率表。(本文作者蓝翊文製)

进球数234578频率113131

由于进球数 \(4\) 和 \(7\) 次出现次数最多、均为 \(3\) 次,因此此笔资料之众数为 \(4\) 及 \(7\)。

B. 已分组资料: 遇到分组资料欲求众数 \((M_0)\) 有以下几个方法:

    金氏法 (King’s method)

    \(\displaystyle M_0=L_{M_0}+\frac{f_{+1}}{f_{+1}+f_{-1}}\times h_{M_0}\)

      \(L_{M_0}\):众数(次数最多的组)所在组的下界\(f_{+1}\):众数所在组之下一组的个数\(f_{-1}\):众数所在组之前一组的个数\(h_{M_0}\):众数所在组的组距。
        克氏法 (Czuber’s method)

        \(\displaystyle M_0=L_{M_0}+\frac{f_{M_0}-f_{-1}}{(f_{M_0}-f_{+1})+(f_{M_0}-f_{-1})}\times h_{M_0}\)

          \(L_{M_0}\):众数(次数最多的组)所在组的下界\(f_{+1}\):众数所在组之下一组的个数\(f_{-1}\):众数所在组之前一组的个数\(f_{M_0}\):众数所在组的个数\(h_{M_0}\):众数所在组的组距。
            皮尔森法 (Pearson’s method)

            其法是使用平均数、中位数及众数之关係所推导:

            \(M_0=\overline{x}-3(\overline{x}-M)\)

            \(\overline{x}:\) 平均数,\(M:\) 中位数,\(M_0:\) 众数

            例: 现有一组已分组资料,记录如下,使用金氏法、克氏法、皮尔森法分别求出众数。

            表五、已分组资料众数计算範例。(本文作者蓝翊文製)

            组界次数29.5-39.5339.5-49.5349.5-59.51059.5-69.5569.5-79.5479.5-89.55

            解:由上表可知,众数落在 49.5-59.5 这组。

            金氏法:\(\displaystyle M_0=49.5+\frac{5}{5+3}\times 10=55.75\)

            克式法:\(\displaystyle M_0=49.5+\frac{10-3}{(10-5)+(10-3)}\times 10=55.33\)

            皮尔森法:\(M_0=\overline{x}-3(\overline{x}-M)\)

            \(\displaystyle\overline{x}=\frac{34.5\times 3+44.5\times 3+…+84.5\times 5}{2+3+…+6}=\frac{1825}{30}=60.833\)

            \(M=49.5+(\frac{30}{2}-6)\times\frac{10}{10}=58.5\)

            \(M_0=60.833-3(60.833-58.5)=53.834\)

            3. 三种主要地位量数之间的关係

            平均数、中位数与众数等三种主要应用的地位量数之大小关係,依据样本的资料型态而定。假设样本均为单模 (single modal) 的形态(即样本的众数发生的位置仅有一处,若以直方图 (histogram) 呈现数据,仅有一处高峰),则三种地位量数的大小关係与资料的偏态 (skewness) 有关(图一)。若资料呈左右对称的分布,则平均数、中位数与众数约略相等。若资料呈右偏(正偏)分布,亦即有少数几个偏大的数据,则平均数 > 中位数 > 众数。若资料呈左偏(负偏)分布,亦即有少数几个偏小的数据,则平均数 < 中位数 < 众数。

            地位量数(下)—中位数、众数

            图一、样本的资料型态。(a) 对称分布 (b) 右偏分布 (c) 左偏分布。(本文作者蓝翊文製)


            参考文献

上一篇: 下一篇:
随机文章
热门文章