U30 數據誤用 必考概念

數據誤用指在統計分析或數據呈現中,有意或無意地使用不恰當的方法,導致結論出現偏差或誤導。本課題旨在識別常見的數據誤用手法,並培養批判性思維。

1 抽樣偏差與數據收集誤用

抽樣偏差

當樣本不能代表總體時,便會出現抽樣偏差。常見類型包括:自願回應偏差(只有特定群體願意回應)、方便抽樣偏差(只選取容易接觸的個體)和無回應偏差(部分被選中者沒有提供數據)。

若總體中每個個體被抽中的概率 $P_i$ 不相等,則樣本統計量 $\bar{x}$ 或 $\hat{p}$ 可能不是總體參數 $\mu$ 或 $p$ 的無偏估計。

$$ E(\bar{x}) eq \mu \quad \text{或} \quad E(\hat{p}) eq p $$
總體 偏差樣本 理想樣本 代表性不足 具代表性

2 數據呈現與圖表誤導

圖像扭曲

通過改變圖表的比例或起點,可以誇大或縮小差異。例如,在棒形圖中,若縱軸不從 $0$ 開始,會使差異看起來比實際大。衡量扭曲程度可考慮視覺高度比與實際數據比的差異。

$$ \text{扭曲比率} = \frac{\text{圖像顯示的高度差}}{\text{從0開始應有的高度差}} $$
A組 B組 A組 B組 0 100 從0開始 非0起點 (誇大差異) (正確呈現)

相關與因果謬誤

兩個變量 $X$ 和 $Y$ 之間存在相關性(即相關係數 $r eq 0$),並不意味著 $X$ 導致 $Y$。可能由第三變量(混雜因素)導致,或純屬巧合。

$$ r_{XY} eq 0 \quad \nRightarrow \quad X \text{ 導致 } Y $$

3 統計量選擇與解讀誤用

集中趨勢量度的誤導

在偏態分佈中,平均數 $\bar{x}$、中位數 $M$ 和眾數 $Mo$ 的位置不同。誤用平均數來代表整體「典型」值可能會產生誤導。

$$ \text{右偏分佈:} \quad Mo < M < \bar{x} $$

例如,若數據中存在極端高值,平均數會被拉高,此時中位數是更穩健的中心量度。

百分比與基數陷阱

比較百分比時必須考慮其基數(即分母)。增長 $x\%$ 的表述可能隱藏了實際數值很小的情況。計算實際變化量為:

$$ \text{實際變化} = \text{基數} \times \frac{x}{100} $$

若基數 $n$ 很小,即使百分比變化很大,實際影響也可能微不足道。

4 批判性評估要點

評估統計聲稱的檢查清單

數據來源與抽樣方法:樣本是否隨機?有否回應偏差?

圖表呈現:坐標軸是否從0開始?比例是否恰當?

使用的統計量:在偏態分佈中使用平均數是否合適?有否提供離差量度(如標準差 $s$)?

相關與因果:是否將相關性錯誤解讀為因果關係?

絕對值與百分比:比較百分比時,基數是否足夠大且被披露?

掌握以上要點,能有效識別日常生活中的數據誤用,作出更理性的判斷。

解題遇到瓶頸?

Learner App 內置 AI 步驟解析技術,拍照即可為你標註所有潛在定理,手把手帶你解題!

立即下載 Learner 取星