はじめに
データを集めてみると、データのパターンが見えてきます。
そしてそれぞれのパターンによって、適切な統計処理方法が決まっています。
それぞれのパターンに沿って、どのような統計処理方法がとられるのかをご紹介したいと思います。今回は、『データが縦に2列並んでいて、2列間に対応関係がないパターン』の統計処理方法についてご紹介します。
パターンの例
同じグループのデータが、縦に2列並んでいることが特徴です。
統計処理方法
上記のようなパターンに適切な統計処理方法は以下の方法があげられます。
1.グラフ表現
2.基礎統計量
3.2つの母平均の区間推定
4.2つの母平均の差の検定
5.ノンパラメトリック検定
グラフ表現
データの特徴を見るためには、グラフ表現が最も優れています。
ヒストグラム、度数分布表、棒グラフ、円グラフ、レーダーチャートなどのたくさんの種類があります。2つのグループのデータをそれぞれグラフに表現して、可視化してみると色々なことが見えてきます。
基礎統計量
グラフの特徴を数値でとらえるには、基礎統計量を算出する方法があります。
それぞれのグループの平均値、中央値、最頻値、最大値、最小値、分散、標準偏差、標本平均、標本分散、標本標準偏差などを算出し、2つのグループの比較をしていきます。
2つの母平均の区間推定
今あるデータは、母集団から取り出した標本だと仮定して、標本平均や標本分散から2つのグループが属する母集団の平均を推定する方法があります。
2つの母平均の差の検定
「2つのグループの母集団は同じであるか」ということを、母平均μ1,μ2に注目して、差の検定を行います。やり方は2つの方法があります。
- 等分散性の検定・・・母分散σ12,σ22は未知であるけれども、σ12とσ22は同じであると仮定する方法
- ウェルチの検定・・・母分散σ12,σ22が未知の場合の方法(母分散σ12,σ22が同じであると仮定しない)
ノンパラメトリック検定
母集団が正規分布に従っているかどうかわからないとき、または、正規分布に従っていないときは、ノンパラメトリック検定を行います。ノンパラメトリック検定で、2つの母集団の差の検定を行うときは『ウイルコクスンの順位和検定』という検定方法がよく使われています。
コメント