基本統計量とは

基本統計量とはデータの基本的な特性を表すものです。平均、最大値、最小値、中央値、分散、標準偏差などがあります。このページで使用するデータとして、まず、以下の仮想的なデータを代入し、散布図を書いてみましょう。

x <- c(2,2,3,4,5,6,6,6,6,7,8,9)
y <- c(8,7,7,5,8,5,4,3,4,3,2,1)
plot(x,y)
plot

関数を使って基本統計量を計算する

Rでは基本統計量を計算する関数がすでに用意されています。以下では順に、平均、最大値、最小値、中央値、分散、標準偏差を求める関数です。分散は不偏分散を計算しているので、標本分散は(N-1)/Nをかけると求められます。

mean(x)
max(x)
min(x)
median(x)
var(x)
sd(x)

共分散と相関係数の計算

これらについても計算する関数がすでに用意されています。以下では順に、共分散と相関係数を求める関数です。

var(x,y)
cor(x,y)