lecture
website icon
分散趨勢
次數分配 集中趨勢 分散趨勢 交叉表
×
website icon 資料管理 統計分析 相關資源 巨人肩膀 語法索引 關於作者

簡介

本部分介紹如何計算分散趨勢,包含全距、標準差、變異數等,使用到的指令包含:

Facebook Icon Twitter Icon LinkedIn Icon LINE Icon

這裡介紹R如何計算全距、標準差等方法,這些數據有助於瞭解資料散布的分散趨勢。本部分以class_12.RData當作範例,說明計算分散趨勢的方法。

全距

range()提供最快速簡便計算全距的方法。

> range(class_12$math)
[1] 48 93

如果不用range(),也可以用max()搭配min()土法煉鋼。

> max(class_12$math)-min(class_12$math)
[1] 45

標準差 \(\sigma\)

sd()計算標準差。

> sd(class_12$math, na.rm=TRUE)
[1] 14.84771

變異數 \(\sigma^2\)

var()計算變異數。

> var(class_12$math, na.rm=TRUE)
[1] 220.4545

偏度

也就是資料呈現的「歪斜」程度。偏度可以為正,也可以為負。負偏態代表資料往右偏,也就是在機率密度函數中左側的尾巴比右側長;反之正偏態代表資料左偏,右尾比左尾長。當偏度為0的時候,表示資料相對均勻地分布在平均數兩側。

偏度可以透過moments package中的skewness()計算。

> library(moments) #載入moments套件
> skewness(class_12$math)
[1] -0.5062247

峰度

也就是峰態係數,是用來衡量資料分布的「尖度」。峰度越大,代表資料越集中,同時變異數越大;反之,則資料越分散。當峰度為0的時候,表示資料接近常態分配。

峰度一樣可透過moments package中的kurtosis()計算。

> kurtosis(class_12$math)
[1] 1.93137