はじめに
データを集めてみると、データのパターンが見えてきます。
そしてそれぞれのパターンによって、適切な統計処理方法が決まっています。
それぞれのパターンに沿って、どのような統計処理方法がとられるのかをご紹介したいと思います。
今回は、『データが縦に6列以上あり、3つ以上のグループの、異なる2種類の測定データがそれぞれ入力されているパターンの統計処理方法』についてご紹介します。
その他のパターンの統計処理方法についてはこちら
パターンの例
統計処理方法
上記のようなパターンに適切な統計処理方法は以下の方法があげられます。
1.グラフ表現
2.基礎統計量
3.判別分析
4.共分散分析
5.多変量分散分析
グラフ表現
データの特徴を見るためには、グラフ表現が最も優れています。
ヒストグラム、度数分布表、棒グラフ、円グラフ、レーダーチャートなどのたくさんの種類があります。それぞれのグループのデータをグラフに表現して、可視化してみると色々なことが見えてきます。
基礎統計量
・グラフの特徴を数値でとらえるには、基礎統計量を算出する方法があります。
それぞれのグループの平均値、中央値、最頻値、最大値、最小値、分散、標準偏差、標本平均、標本分散、標本標準偏差などを算出し、グループの比較をします。
判別分析
上記のサンプルデータを例にして散布図を描いてみました。2つのグループ間に差がありそうな気がしませんか。このような時に、判別分析を行います。
判別分析には、線型判別関数による方法と、マハラノビスの距離による判別と2つの方法があります。
共分散分析
3つ以上のグループ間に差があるかどうかを調べるときには、分散分析と多重比較を行います。
今回のデータのパターンのように、グループ内に変量が2変量以上ある場合は、共分散分析という分析方法を使います。
それぞれのグループの中には2つの変量(X1,X2)があり、X1について2つのグループ間の差を調べたい。けれども、X2の因子も無視できない。。。こういったときに、X2を「共変量」と考えて、共分散分析を行います。X1,X2の関係が、注目したい変量と補助的な役割の変量からなるデータである場合に共分散分析を選択します。
多変量分散分析
3つ以上のグループ間に差があるかどうかを調べるときには、分散分析と多重比較を行います。
今回のデータのパターンのように、グループ内に変量が2変量以上ある場合は、多変量分散分析という分析方法を使います。
コメント