R統計 | 分散趨勢

簡介

本部分介紹如何計算分散趨勢，包含全距、標準差、變異數等，使用到的指令包含：

這裡介紹R如何計算全距、標準差等方法，這些數據有助於瞭解資料散布的分散趨勢。本部分以class_12.RData當作範例，說明計算分散趨勢的方法。

range()提供最快速簡便計算全距的方法。


     > range(class_12$math)

     [1] 48 93

如果不用range()，也可以用max()搭配min()土法煉鋼。


     > max(class_12$math)-min(class_12$math)

     [1] 45

sd()計算標準差。


     > sd(class_12$math, na.rm=TRUE)

     [1] 14.84771

var()計算變異數。


     > var(class_12$math, na.rm=TRUE)

     [1] 220.4545

也就是資料呈現的「歪斜」程度。偏度可以為正，也可以為負。負偏態代表資料往右偏，也就是在機率密度函數中左側的尾巴比右側長；反之正偏態代表資料左偏，右尾比左尾長。當偏度為0的時候，表示資料相對均勻地分布在平均數兩側。

偏度可以透過moments package中的skewness()計算。


     > library(moments) #載入moments套件

     > skewness(class_12$math)

     [1] -0.5062247

也就是峰態係數，是用來衡量資料分布的「尖度」。峰度越大，代表資料越集中，同時變異數越大；反之，則資料越分散。當峰度為0的時候，表示資料接近常態分配。

峰度一樣可透過moments package中的kurtosis()計算。


     > kurtosis(class_12$math)

     [1] 1.93137