はじめに
データを集めてみると、データのパターンが見えてきます。
そしてそれぞれのパターンによって、適切な統計処理方法が決まっています。
それぞれのパターンに沿って、どのような統計処理方法がとられるのかをご紹介したいと思います。
今回は、『同じグループのデータが縦に3列並んでいるパターン』の統計処理方法についてご紹介します。
その他のパターンの統計処理方法についてはこちら
パターンの例
統計処理方法
上記のようなパターンに適切な統計処理方法は以下の方法があげられます。
1.グラフ表現
2.基礎統計量
3.3つの母平均の区間推定
4.1元配置分散分析と多重比較
5.ノンパラメトリック検定
グラフ表現
データの特徴を見るためには、グラフ表現が最も優れています。
ヒストグラム、度数分布表、棒グラフ、円グラフ、レーダーチャートなどのたくさんの種類があります。それぞれのグループのデータをグラフに表現して、可視化してみると色々なことが見えてきます。
基礎統計量
グラフの特徴を数値でとらえるには、基礎統計量を算出する方法があります。
それぞれのグループの平均値、中央値、最頻値、最大値、最小値、分散、標準偏差、標本平均、標本分散、標本標準偏差などを算出し、グループの比較をしていきます。
3つの母平均の区間推定
今あるデータは、母集団から取り出した標本だと仮定して、標本平均や標本分散からそれぞれのグループが属する母集団の平均を推定する方法があります。
1元配置分散分析と多重比較
「3つのグループ、変数1の母平均,変数2の母平均,変数3の母平均は同じである」と仮定して、グループ間に差がないことを検定をする際に、一元配置分散分析という手法を使います。
検定の結果仮説が棄却され、「3つのグループ間に差がある」という結果になり、どこに差があるのかを見ていく際の手法として、『多重比較』という手法を使います。
ノンパラメトリック検定
母集団が正規分布に従っているかどうかわからないとき、または、正規分布に従っていないときは、ノンパラメトリック検定を行います。ノンパラメトリック検定で、1元配置分散分析を行う際は、『クラスカル・ウォリス』という検定や、『ヨンクヒール』といった検定方法がよく使われています。
コメント