はじめに
データを集めてみると、データのパターンが見えてきます。
そしてそれぞれのパターンによって、適切な統計処理方法が決まっています。
それぞれのパターンに沿って、どのような統計処理方法がとられるのかをご紹介したいと思います。
今回は、『データが縦に2列並んでいて、表題と2つのグループの観測されたデータの個数がそれぞれ入力されているパターン』の統計処理方法についてご紹介します。
その他のパターンの統計処理方法についてはこちら
パターンの例
統計処理方法
上記のようなパターンに適切な統計処理方法は以下の方法があげられます。
1.グラフ表現
2.基礎統計量
3.2つの母比率の区間推定
4.2つの母比率の差の検定
5.独立性の検定
グラフ表現
データの特徴を見るためには、グラフ表現が最も優れています。
ヒストグラム、度数分布表、棒グラフ、円グラフ、レーダーチャートなどのたくさんの種類があります。それぞれのグループのデータをグラフに表現して、可視化してみると色々なことが見えてきます。
データの個数よりも、データが占める割合を表現するとわかりやすく可視化することができます。
基礎統計量
測定値ではなく、観測されたデータの個数が入っているので、統計量としては「標本比率」を求めましょう。
2つの母比率の区間推定
標本比率からそれぞれのグループの母集団の母比率の区間推定をすることができます。この2つの母比率の信頼区間から2つのグループを比較してみましょう。
2つの母比率の差の検定
2つのグループ間に差があるかどうかを調べてみましょう。
分析方法としては、以下の2つの種類があります。
・正規分布による方法
・カイ2乗分布による方法
独立性の検定
2つのグループ間に何らかの関連性があるかどうかを見たいときは、独立性の検定を行います。
コメント