はじめに
データを集めてみると、データのパターンが見えてきます。
そしてそれぞれのパターンによって、適切な統計処理方法が決まっています。
それぞれのパターンに沿って、どのような統計処理方法がとられるのかをご紹介したいと思います。
今回は、『データが縦に2列並んでいて、その2列の変量は種類の異なるデータが入力されているパターン』の統計処理方法についてご紹介します。
その他のパターンの統計処理方法についてはこちら
パターンの例
2変量は種類の異なるデータが入っているので、2変量間の関係や、2変量の総合化、2変量の共通点などを調べてみたいと考えるでしょう。
統計処理方法
上記のようなパターンに適切な統計処理方法は以下の方法があげられます。
1.グラフ表現
2.基礎統計量
3.回帰分析
4.主成分分析
5.因子分析
グラフ表現
データの特徴を見るためには、グラフ表現が最も優れています。
ヒストグラム、度数分布表、棒グラフ、円グラフ、レーダーチャートなどのたくさんの種類があります。それぞれのグループのデータをグラフに表現して、可視化してみると色々なことが見えてきます。
今回のパターンの場合は、同じものに関する2つの値を測定しているため、散布図を書いてみるとわかりやすく表現できます。
基礎統計量
グラフの特徴を数値でとらえるには、基礎統計量を算出する方法があります。
それぞれのグループの平均値、中央値、最頻値、最大値、最小値、分散、標準偏差、標本平均、標本分散、標本標準偏差などを算出し、グループの比較をしていきます。
今回のパターンの場合は、共分散や相関係数も算出しておきましょう。
回帰分析
相関係数の検定や、無相関の検定を行って、相関の有無を調べてみましょう。
そして2変量間に相関があることが分かれば、回帰分析をしてみましょう。
回帰直線を求めて、回帰式から、結果を予測したり、原因を調べたりすることができます。
主成分分析
主成分分析を行うと、総合的評価や順位付けをすることができます。
因子分析
因子分析は、2つの変量間に共通する原因を調べたいときに因子分析を行います。
コメント