ヘルプ

<< 正規分布曲 上限限界10% のページ検索結果にもどる

このページでは http://hs-www.hyogo-dai.ac.jp/~kawano/HStat/?plugin=cssj&pages=2010%2F10th%2C2010%2F10th%2FNormal_Distribution%2C2010%2F10th%2FCalculated_by_Standardization%2C2010%2F10th%2FPopulation_and_Sample%2C2010%2F10th%2FEstimation&title=%E7%AC%AC10%E5%9B%9Eのキャッシュを表示しています。

キャッシュとは、提携する検索エンジンが、検索結果表示用の索引を作る際に各ページの内容を保存したものです。
→ キャッシュとは?
元のページは変更されている可能性があります。現在のページ内容はこちらから確認できます。

※HTMLバージョンとして表示する際、レイアウトが崩れたり、文字が読めなくなる場合があります。ご了承ください。

Yahoo! JAPANはページ内のコンテンツとの関連はありません。

健康統計学第10回
Page 1
健康統計学第10回
今回は、前回に引き続き、確率分布(テキスト53∼63ページ)について学習します。とくに、正規分布(標準正規分
布)、カイ二乗分布、t分布、F分布について説明します。
また、母集団統計値の推定(テキスト65∼76ページ)についても学習します。
テキスト
『やさしい保健統計学改訂第4版』縣俊彦著(南江堂)
今回の内容
- 1

Page 2
正規分布と関連する分布
自然界や一般に観察できる多くのものについて、その分布は、平均値を中心に左右対称の釣り鐘状の分布になっているこ
とがあります。
生物現象、毎年の雨量など
身長や体重、標準的なテストの成績など
正規分布 (normal distribution)
正規分布とは
平均値を中心とした左右対称の釣り鐘状になる分布を、「正規分布」という
は円周率で、
は自然対数の底で、
: 平均値
: 標準偏差
: 分散
確率密度関数が上の式になるとき、『
は、平均が
で標準偏差が
の正規分布にしたがう』といい、
と表す
つまり、平均値と分散(標準偏差)から分布が決まる
さまざまな推定や検定に使われる
正規分布の特徴
分布の中心は平均値
で、最も高い値(極大値)をとる
平均値が変化すると、分布が左右に移動する
で変曲点(曲線の凹凸の変わり目)になる
標準偏差が変化すると、分布の高さや広がりが変化する
平均値、中央値、最頻値は一致する
平均値と標準偏差から、分布の割合(曲線とx軸に囲まれる面積)が決まる
の範囲 : 全体の約 68.24% を含む
の範囲 : 全体の約 95.44% を含む
の範囲 : 全体の約 97.73% を含む
それ以外の範囲 : 全体の約 0.27% を含む
標準正規分布
標準正規分布とは
正規分布で、平均値が 0 、標準偏差が 1 になるように、正規分布の確率密度関数の変数
を次のように変換する(変数変換)
すると、標準偏差の式は次のように変形される
2 - 正規分布と関連する分布

Page 3
確率密度関数が上の式になるとき、『
は、標準正規分布にしたがう』という
は、平均が 0 で標準偏差が 1 の正規分布にしたがう』ことになり、
と表すことができる
つまり、変数だけから分布が決まる
さまざまな推定や検定に使われる
標準化(基準化)(standardization)
先ほどの変数変換を、「標準化」まはた「基準化」という
(感覚としては)分布を平均値の分だけ 0 まで移動し、分布の広がりを
にする
単位の異なるデータや平均値・分散が異なるデータを比較するときに使う(英語と数学のテストの成績の比較)
ちなみに偏差値は、標準化を応用したもので、次のような式になる
標準正規分布の特徴
基本的な特徴は、正規分布と同じ
分布の曲線とx軸で囲まれた全体の面積は1になり
すなわち、面積が確率(割合)を表すことになる
カイ二乗分布
カイ二乗分布とは
変数
が標準正規分布にしたがい、互いに独立であるとする
次のようになるとき、『
は、自由度
のカイ二乗(
)分布にしたがう』という
自由度とは分布の形状に影響を及ぼす値で、自由度の値が変わると分布の形状も変化する
カイ二乗分布の特徴
平均は
、分散は
になる
適合度や独立性の検定など、分散の推定や検定に利用される
自由度が大きくなると、対称な分布に近づく
- 3

Page 4
t分布
t分布とは
標準正規分布にしたがう確率変数
と、自由度
のカイ二乗分布
にしたがう確率変数
があり、互いに独立である
とする
次のようになるとき、『
は、自由度
のt分布にしたがう』という
(感覚としては)正規分布にしたがう統計量を標準化したものの分布を表す
この分布を発表した William Gosset のペンネームから「スチューデント(Student)のt分布」とも呼ぶ
t分布の特徴
平均は 0 、分散は
になる
自由度が大きくなると、標準正規分布に近づく
自由度が小さいときは、正規分布よりも裾の長い分布になる
母平均の推定や検定、平均値の差の検定や検定など、多くの統計的推定で利用される
F分布
F分布とは
確率変数
と確率変数
が、それぞれ自由度
のカイ二乗分布にしたがい、互いに独立であるとする
次のようになるとき、『
は、第一自由度が
で第二自由度が
のF分布にしたがう』という
(感覚としては)分散の比率についての分布を表す
F分布の特徴
2つの自由度を持つ
分散検定や分散分析(分散比の分布を調べる)に利用される
平均は
、分散は
になる
4 - 正規分布と関連する分布

Page 5
標準化を用いた確率の計算
標準得点(標準正規分布の復習)
平均が
、分散が
の正規分布から、標準正規分布を導くときに、次の式を用いて標準化を行います。
このときの
を、標準得点(standardized score)といいます。
標準得点は、平均が0、分散が1の標準正規分布
にしたがいます。
標準得点を使った確率の計算
正規分布とみなされるデータを標準化すれば、標準正規分布表を用いて、確率を計算することができます。
例題
高校3年生のAさんの身長は175cmである。Aさんが入学する、B大学の学生の身長について、平均は182cm
で、標準偏差は8.3cmである。このとき、B大学の学生がAさんより身長が高い確率を求める。
確率の求め方
1. まず、B大学の学生の身長を
として、標準得点を計算する。
2. 標準得点
は標準正規分布にしたがうので、標準正規分布表を用いて、確率を求める。
「身長が175cmより大きい」ということは、標準得点が次のようになるということである。
3. したがって、「身長が175cmより大きい」確率
は、標準正規分布表から
の値を求めればよい。
つまり、「B大学の学生がAさんより身長が高い確率」は約80%(0.8)となる。
- 5

Page 6
母集団と標本
母集団と標本
全数調査と標本調査
全数調査、または悉皆(しっかい)調査
全体について調べる(例:国勢調査)
標本調査
全体から選び出した一部分について調べる(例:選挙予測)
時間的・経済的に現実的な調査
母集団と標本
母集団(population)
標本調査のもとになる集団
母集団の大きさを、
であらわす
標本(sample)
母集団から抽出(サンプリング)された一部分
標本の大きさ(サンプルサイズ:標本に含まれる個数)を、
であらわす
標本の抽出
推測統計学(inductive statistics)
標本にもとづいて母集団の特性値(母数:平均、分散などのパラメータ)を推定・予測する
2つ以上の母集団の特性値を比較・検討する
標本が「母集団の精巧なミニチュア」になるように、偏りなく標本を抽出しないといけない
無作為抽出法(random sampling)
母集団から無作為に標本を抽出する
乱数表(無規則に数字を羅列した表)等をもとに、データ(個体)を標本として選ぶ
どの標本も全く等しい確率で選ばれる(主観や作為などが入る余地がない)
母集団が大きい場合は実施が困難(例えば数万人の名簿を作るのは容易ではない)
系統抽出法(systematic sampling)
最初の標本のみ乱数表などで選ぶ
あとの標本は一定間隔(抽出間隔;sampling interval)で抽出する
実際には抽出間隔が扱いやすい数でない場合が多い
無作為抽出法と同じで、母集団が大きい場合は実施が困難
多段抽出法(multi-stage sampling)
何段階かのステップを経て標本を抽出する(例:2段階抽出法)
何段階かのステップで標本にする対象を絞り込み、最後に無作為抽出法で標本を選ぶ
4段階の例:全国→都道府県→市町村→病院・診療所→看護師(あとは無作為抽出)
調査の手間ひまが少なく実践的だが、標本の偏り(バイアス)に注意しないといけない
層別抽出法(stratified sampling)
母集団を同じ特徴(年代、職業、都道府県など)で層に分ける(層別化)
6 - 母集団と標本

Page 7
層の構成比に応じて適切な数だけ、層ごとに無作為抽出法で標本を選ぶ
層の違いによって偏りがある状況が事前に予測される場合に適している(地域と政党の支持率、年代と好きな芸能人)
母集団の特徴を少なくとも1つは事前に知っている必要がある
- 7

Page 8
点推定と区間推定
点推定(point estimation)
点推定とは
標本の特性値1つから母集団の特性値を推定する
母数(パラメータ):母集団の特性値(統計量)
母平均(母集団の平均)、母分散(母集団の分散)、母比率(母集団の比率)
直接調べることはできない
推定量:標本をもとに母数として推定した統計量
標本平均(標本の平均)、不偏分散(標本の分散)、標本比率(標本の比率)
推定値:推定量から求めた具体的な値
点推定では、標本の推定値が必ずしも母数と一致するとは限らない(たいてい誤差が生じる)
推定量の望ましい性質
不偏性
その期待値(平均値)が母数と一致する推定量を「不偏推定量」という
標本平均について、その期待値は母平均に一致する(中心極限定理へ)
一致性
標本数を大きくしていくと推定値が母数に近づく推定量を「一致推定量」という
大数の法則から明らか(統計的確率は数学的確率に近づく)
有効性
ある母数に対して2つ以上の推定量がある場合に分散(誤差)の小さい推定量を「有効推定量」という
標本の中央値に比べ、標本平均の方が、分布の分散が小さい
区間推定(interval estimation)
区間推定とは
標本の推定量から、「ある確率」で、母集団の特性値(母数)の範囲を示す
信頼区間と信頼係数
信頼区間
「ある」確からしさで示される、母集団の特性値の範囲
95%信頼区間
標本から平均値を出したとき、母平均(母集団の平均)がその区間にあるのが100回中95回以上の確率で、間違え
る危険性が5回未満
99%信頼区間
標本から平均値を出したとき、母平均(母集団の平均)がその区間にあるのが100回中99回以上の確率で、間違え
る危険性が1回未満
注意:「母平均の値が95(または99)%の確率でその区間のどこかにある」と解釈してはいけない
信頼限界:信頼区間の上限および下限の値
8 - 点推定と区間推定

Page 9
信頼係数
区間推定の確実性をあらわし、「1-α」(αは0.05または0.01)であらわす
信頼度 : 100×(1-α) %
区間推定の考え方
1. 標本の推定量(標本平均、標本比率など)の分布を選択する
(標準)正規分布、t分布、F分布、カイ2乗分布
2. 推定量の分布の平均と分散(標準偏差)を求める
3. 母数にあった方法で、信頼区間を算出する
一般的には次のようになる
信頼下限:<推定量の平均>−<分布における確率αの値>×<推定量の標準偏差>
信頼上限:<推定量の平均>+<分布における確率αの値>×<推定量の標準偏差>
中心極限定理(central limit theorem)
平均が
、分散が
の母集団から大きさ
の標本を抽出して、その標本平均
を調べると、その分布は平均が
、分
散が
の正規分布に従う(
は十分大きな数とする)
つまり、「標本平均の平均(期待値)は、母集団の平均に一致する」
また、「母集団の分布に関係なく、標本平均の平均は正規分布にしたがう」
母集団が正規分布にしたがうなら、標本の大きさにかかわらず、中心極限定理が成り立つ
- 9