▼ 平均値について ▼
n個のデータ x1 , x2 , x3 , ・・・ , xn の総和を
nで割った値を平均値という。ここでは,平均値を/xで表すことにする。
【 /x=(1/n)(x1+x2+x3+ ・・・ +xn) 】
▼ 中央値(メジアンについて) ▼
データの値を大きさの順に並べたとき,
中央の位置にくる値を中央値またはメジアンという。
【 データの値が奇数(n)個ある場合,
中央値はデータの値を大きさの順に並べたときの
(n+1)/2 番目の値である。
データの値が偶数個(n)個ある場合,
中央値はデータの大きさの順に並べたときの
(n/2)番目の値と(n+1)/2番目の値の平均値である。 】
▼ 最頻値(モード)・範囲(レンジ)について ▼
【 データにおいて,最も個数の多い値を最頻値またはモードという。
また,データの最大値と最小値の差を範囲またはレンジという。 】
▼ 四分位数について ▼
データの値を大きさの順に並べたとき,4等分する位置にくる値を四分位数
といい,小さい方から第1四分位数,第2四分位数,第3四分位数という。
第1四分位数はQ1 , 第2四分位数はQ2 , 第3四分位数はQ3で表す。
【 データの値を小さい順に並べたとき,左半分のデータの中央値がQ1 ,
右半分のデータがQ3である。Q2はデータ全体の中央値である。
ただし,データの値が奇数個ある場合,
中央の位置にくる値(Q2)はQ1にもQ3にも含めない。
Q3-Q1を四分位範囲 , (Q3-Q1)/2を四分位偏差という。
四分位範囲や四分位偏差が大きいほど,
データの散らばり度合いが大きいと考えられる。 】
▼ 分散・標準偏差について ▼
変量xについての(各データの総称がxである)
n個のデータ x1 , x2 , x3 , ・・・ , xnの
平均値を(/x)としたとき,
x1-(/x) , x2-(/x) , ・・・ , xn-(/x)を
それぞれ平均値からの偏差という。
偏差の平均値を計算すると,次のようになる。
(1/n)[{x1-(/x)}+{x2-(/x)}+ ・・・ +{xn-(/x)}]
= (1/n){(x1+x2+x3+ ・・・ +xn)-n(/x)}
= (1/n)(x1+x2+x3+ ・・・ +xn)-(/x)
= (/x)-(/x)
= 0
よって,偏差の平均値ではデータの散らばりの度合いを
表すことができない。そこで,偏差の2乗の平均値を考える。
【 偏差の2乗の平均値を分散といい,分散の正の平方根を標準偏差という。
分散はs^2 , 標準偏差はsで表す。分散や標準偏差が大きいほど,
データの散らばり度合いが大きいと考えられる。 】
x^2のデータ (x1)^2 , (x2)^2 , (x3)^2 , ・・・ , (xn)^nの
平均値を{/(x^2)} , (/x)の2乗を(/x)^2とすると,
s^2は次のように表すことができる。
s^2 = (1/n)[{x1-(/x)}^2+{x2-(/x)}^2+ ・・・ +{xn-(/x)^2}]
= (1/n){(x1)^2+(x2)^2+(x3)^2+ ・・・ +(xn)^2-2(/x)(x1+x2+x3+ ・・・ +xn)+n(/x)^2}
= {/(x^2)}-2(/x)^2+(/x)^2
= {/(x^2)}-(/x)^2
よって,次のことがいえる。
【 s^2 = (x^2のデータの平均値) - (xのデータの平均値)^2
s = √{(x^2のデータの平均値) - (xのデータの平均値)^2} 】
▼ 正の相関関係・負の相関関係について ▼
【 2つのデータにおいて,一方が増えると他方も増える傾向があるとき,
2つのデータは正の相関関係があるという。
逆に,一方が増えると他方が減る傾向があるとき,
2つのデータは負の相関関係があるという。
どちらの傾向もないときは,相関関係がないという。 】
例えば,身長と体重のデータは正の相関関係があるといえる。
▼ 相関係数について ▼
2つのデータ x1 , x2 , x3 , ・・・ , xnと
y1 , y2 , y3 , ・・・ , ynの平均値をそれぞれx , yとし,
標準偏差はそれぞれsx , syとする。
xの偏差とyの偏差の積の平均値を共分散といい,sxyで表す。
このとき,【 (sxy)/(sxsy)を相関係数といい,rで表す。 】
パート24へ続きます。