はじめに
データを集めてみると、データのパターンが見えてきます。
そしてそれぞれのパターンによって、適切な統計処理方法が決まっています。
それぞれのパターンに沿って、どのような統計処理方法がとられるのかをご紹介したいと思います。
今回は、『データが縦に2列並んでいて、2列間に「前後」等の対応関係のあるパターン』の統計処理方法についてご紹介します。
その他のパターンの統計処理方法についてはこちら
パターンの例
統計処理方法
上記のようなパターンに適切な統計処理方法は以下の方法があげられます。
1.グラフ表現
2.基礎統計量
3.対応のある2つの母平均の差の検定
4.ノンパラメトリック検定
グラフ表現
データの特徴を見るためには、グラフ表現が最も優れています。
ヒストグラム、度数分布表、棒グラフ、円グラフ、レーダーチャートなどのたくさんの種類があります。それぞれのグループのデータをグラフに表現して、可視化してみると色々なことが見えてきます。
「前後」の関係のあるパターンの場合、前-後(後-前)のように、差をとったデータをグラフ化してみるとわかりやすく表現できる場合があります。
基礎統計量
グラフの特徴を数値でとらえるには、基礎統計量を算出する方法があります。
それぞれのグループの平均値、中央値、最頻値、最大値、最小値、分散、標準偏差、標本平均、標本分散、標本標準偏差などを算出し、グループの比較をしていきます。
「前後」の関係のあるパターンの場合、前-後(後-前)のように、差をとったあとに、平均や分散などを求めると、差を中心に、どのようにデータが存在しているのかがうまく表現できる場合があります。
対応のある2つの母平均の差の検定
2つのデータに対応関係がある場合は、『対応のある2つの母平均の差の検定』という手法を使います。
ノンパラメトリック検定
母集団が正規分布に従っているかどうかわからないとき、または、正規分布に従っていないときは、ノンパラメトリック検定を行います。ノンパラメトリック検定で、対応のある2つの母集団の比較を行うときは『ウイルコクスンの順位和検定』もしくは、『符号検定』という検定方法がよく使われています。2つの母集団の分布の形が対称な時は『ウイルコクスンの順位和検定』、対象ではないときは『符号検定』を選択します。
コメント