U46 離差的量度 必考公式

離差(或稱離散程度)用於描述一組數據的分散或變異程度。常用的量度包括全距、四分位數間距、方差及標準差。理解這些概念對於比較不同數據組的穩定性至關重要。

1 全距與四分位數間距

全距 (Range)

全距是最簡單的離差量度,計算方法為數據的最大值減去最小值。它容易受極端值影響,未能反映數據內部的分佈情況。

$$ \text{全距} = \text{最大值} - \text{最小值} $$
全距 最小值 最大值

四分位數間距 (Interquartile Range, IQR)

四分位數間距是上四分位數 $Q_3$ 與下四分位數 $Q_1$ 之差,它反映了中間 $50\%$ 數據的離散程度,不受極端值影響,是分析數據分佈的穩健量度。

$$ \text{IQR} = Q_3 - Q_1 $$

2 方差與標準差

方差 (Variance)

方差是每個數據點與算術平均數 $\bar{x}$ 之差的平方的平均值。對於一組數據 $x_1, x_2, \dots, x_n$,其總體方差 $\sigma^2$ 和樣本方差 $s^2$ 的公式有所不同。

$$ \sigma^2 = \frac{\sum_{i=1}^{N} (x_i - \mu)^2}{N} \quad \text{(總體)} $$

樣本方差的除數是 $n-1$,這稱為貝塞爾校正,目的是得到總體方差的無偏估計。

$$ s^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n-1} \quad \text{(樣本)} $$

標準差 (Standard Deviation)

標準差是方差的平方根,其單位與原始數據相同,因此更易於解釋。它衡量數據點偏離平均值的平均距離。

$$ \sigma = \sqrt{\sigma^2} \quad \text{或} \quad s = \sqrt{s^2} $$
$\bar{x}$ $s$ 或 $\sigma$ 標準差衡量數據圍繞平均值的分散程度

3 數據變換對離差的影響

線性變換的影響

若將每項數據進行 $y = a x + b$ 的線性變換,其中 $a$ 和 $b$ 為常數,則新的離差量度與原數據的關係如下。注意:加上常數 $b$ 不會改變離差。

$$ \begin{aligned} \text{新全距} &= |a| \times \text{舊全距} \\ \text{新IQR} &= |a| \times \text{舊IQR} \\ \text{新標準差} &= |a| \times \text{舊標準差} \\ \text{新方差} &= a^2 \times \text{舊方差} \end{aligned} $$

4 比較不同數據組的離差

變異係數 (Coefficient of Variation, C.V.)

當需要比較單位不同或平均值相差很大的數據組的離散程度時,可以使用變異係數。它是標準差與平均值的百分比,是一個無單位的相對量度。

$$ \text{C.V.} = \frac{\sigma}{\mu} \times 100\% \quad \text{或} \quad \text{C.V.} = \frac{s}{\bar{x}} \times 100\% $$

變異係數越小,表示數據的相對離散程度越小,即數據越集中。

解題遇到瓶頸?

Learner App 內置 AI 步驟解析技術,拍照即可為你標註所有潛在定理,手把手帶你解題!

立即下載 Learner 取星