這裡介紹R如何計算全距、標準差等方法,這些數據有助於瞭解資料散布的分散趨勢。本部分以class_12.RData當作範例,說明計算分散趨勢的方法。
全距
range()提供最快速簡便計算全距的方法。
> range(class_12$math)
[1] 48 93
如果不用range(),也可以用max()搭配min()土法煉鋼。
> max(class_12$math)-min(class_12$math)
[1] 45
標準差 \(\sigma\)
sd()計算標準差。
> sd(class_12$math, na.rm=TRUE)
[1] 14.84771
變異數 \(\sigma^2\)
var()計算變異數。
> var(class_12$math, na.rm=TRUE)
[1] 220.4545
偏度
也就是資料呈現的「歪斜」程度。偏度可以為正,也可以為負。負偏態代表資料往右偏,也就是在機率密度函數中左側的尾巴比右側長;反之正偏態代表資料左偏,右尾比左尾長。當偏度為0的時候,表示資料相對均勻地分布在平均數兩側。
偏度可以透過moments package中的skewness()計算。
> library(moments) #載入moments套件
> skewness(class_12$math)
[1] -0.5062247
峰度
也就是峰態係數,是用來衡量資料分布的「尖度」。峰度越大,代表資料越集中,同時變異數越大;反之,則資料越分散。當峰度為0的時候,表示資料接近常態分配。
峰度一樣可透過moments package中的kurtosis()計算。
> kurtosis(class_12$math)
[1] 1.93137