データが縦に2列並んでいて、表題と観測されたデータの個数が入力されているパターンの統計処理方法

序章

はじめに

データを集めてみると、データのパターンが見えてきます。
そしてそれぞれのパターンによって、適切な統計処理方法が決まっています。

それぞれのパターンに沿って、どのような統計処理方法がとられるのかをご紹介したいと思います。
今回は、『データが縦に2列並んでいて、表題と観測されたデータの個数が入力されているパターン』の統計処理方法についてご紹介します。
その他のパターンの統計処理方法についてはこちら

パターンの例

統計処理方法

上記のようなパターンに適切な統計処理方法は以下の方法があげられます。
1.グラフ表現
2.基礎統計量
3.母比率の区間推定
4.母比率の検定

グラフ表現

データの特徴を見るためには、グラフ表現が最も優れています。
ヒストグラム、度数分布表、棒グラフ、円グラフ、レーダーチャートなどのたくさんの種類があります。それぞれのグループのデータをグラフに表現して、可視化してみると色々なことが見えてきます。

データの個数よりも、データが占める割合を表現するとわかりやすく可視化することができます。

基礎統計量

平均値や分散は算出することができません。
測定値ではなく、観測されたデータの個数なので、比率にすることがポイントです。
上記データ例とすると、
・「アレルギーあり」の人の標本比率
   = (450÷(450+642))×100 = 41.2088
・「アレルギーなし」の人の標本比率
   = (462÷(450+642))×100 = 58.7912

母比率の区間推定

母集団の分布は2項分布になっているので、母集団の比率を推計することができます。

母比率の検定

A塾では、B大学の合格率は毎年30%であった。A塾に通っている今年の受験者のうち、20人の合否を調べると、B大学の合格者が8人いた。B大学の合格率が 30% から変化しているかどうかをみたい。
こういう場合に母比率の検定を行うと、今年の合格率はどれくらいだったのかを確かめることができます。

コメント

タイトルとURLをコピーしました