基本統計量とはデータの基本的な特性を表すものです。平均、最大値、最小値、中央値、分散、標準偏差などがあります。このページで使用するデータとして、まず、以下の仮想的なデータを代入し、散布図を書いてみましょう。
x <- c(2,2,3,4,5,6,6,6,6,7,8,9) y <- c(8,7,7,5,8,5,4,3,4,3,2,1) plot(x,y)
Rでは基本統計量を計算する関数がすでに用意されています。以下では順に、平均、最大値、最小値、中央値、分散、標準偏差を求める関数です。分散は不偏分散を計算しているので、標本分散は(N-1)/Nをかけると求められます。
mean(x) max(x) min(x) median(x) var(x) sd(x)
これらについても計算する関数がすでに用意されています。以下では順に、共分散と相関係数を求める関数です。
var(x,y) cor(x,y)