統計って数学というよりも算数に近い。足し算、引き算、掛け算、割り算でなんとかできてしまう。
特に文系の人、ベクトルか数列がチンプンカンプンでもう捨てよう!なんて考えている人にはぜひやってもらいたい。
以下の用語は覚えないと解けないので覚えよう△で書かれているものは少し難しい。なのでできるようにするかは自分で決めよう。もし覚えなくてもセンターの第五問は20点満点中15点以上は取れるはずだ。
統計
例を挙げて考えていくのでそのデータを
「8、2、9、3、9、2、9、3、8、4、5、7、0、4、5、2」とする。
■◎度数
・・・ある値のデータの個数。
例)9の度数は3、0の度数は1
■◎相対度数
・・・その値のデータの個数が全体の何割を占めているかを示す割合
例)9の相対度数は3/16
■◎平均値
データを「

,

,・・・

,

」とすると
平均値=(

+

+・・・

+

) /n
例) (8+2+9+3+9+2+9+3+8+4+5+7+0+4+5+2)/16=5
■◎中央値
・・・変量を小さい順に並べた時に真ん中にくる数のこと。もし変量が偶数個あるなら真ん中の前後の値の平均をとる。
例)小さい順に並び替えると「0、2、2、2、3、3、4、4、5、5、7、8、8、9、9、9」
偶数個だから真ん中の前後の値4と5の平均をとって4.5が中央値となる。
ここからもわかるように中央値≠平均値なので注意
■◎最頻値
・・・データの中で最も多く出てくる変数のこと。
例)2と9が三回ずつ出てくる。つまり最頻値は2と9
最頻値は大抵一個だがこのように二つになることもある。
■◎範囲
・・・変数の最大値、最小値の差
例)最大値・・・9 最小値・・・0
つまり範囲は9-0=9
■偏差
・・・変量―平均値
例)平均値は5だったので偏差は
「3、-3、4、-2、4、-3、4、-2、3、-1、0、2、-5、-1、0、-3」
■分散
・・・[math](偏差)^2[/math]の平均値
例)分散=(9+9+16+4+16+9+16+4+9+1+0+4+25+1+0+9)/16=8.25
■標準偏差
・・・√分散
例)標準偏差=√8.25=2.87・・・
△共分散
データ「

,

,・・・

,

」と「

,

,・・・

,

」があるとすると共分散は
共分散={(

-xの平均値)(

-yの平均値)+(

-xの平均値)(

-yの平均値)+・・・(

-xの平均値)(

-yの平均値)}/n
と表せる。つまりはxの偏差とyの偏差の積の平均値である
△相関係数
共分散÷(xの標準偏差×yの標準偏差)
この値は必ず-1~1の間にある。
負の値なら負の相関関係があるといい、正の値なら正の相関関係があるという。
※たまにグラフが出てくる。
その各々の点が全体的に/という風になっていれば正の相関関係\ならば負の相関関係、そして傾きが大きくなればなるほど相関係数は大きくなる。