正規分布

ある農協で収穫されたトマト973個の重量を計測したところ、次の表のようになったとします。
階級(g)階級値度数相対度数
100以上〜120未満110170.0175
120以上〜140未満1301580.1624
140以上〜160未満1504390.4512
160以上〜180未満1702670.2744
180以上〜200未満190810.0832
200以上〜220未満210110.0113
 計  9731.0000

表中の相対度数を階級値Xに対する確率と考えると、この表は一つの確率分布を与えます。
横軸にトマトの重量をとり、縦軸に相対度数をとって、この表のヒストグラムを描くと、右図のようになりますが、トマトの質量
Xとなる確率0.7256は、右上図の灰色着色部の面積になります。
トマトの個数を増やし、階級を細かくして行くと、ヒストグラムは次第に連続な曲線に近づいていきます。
そこで、確率変数
Xが連続な値をとるとして、確率分布を表す曲線を考え、直線,直線,曲線x軸で囲まれる部分(右下図の灰色着色部、)面積となる確率とします。この曲線を分布曲線と言いますが、定義域をとして、以下のような性質を持ちます。
(i) 全区間において
(ii) (定積分を参照)
(iii)
このとき、Xを連続型確率変数、確率分布を連続型確率分布、を確率密度関数と言います。
また、上記の連続型確率分布について、期待値、分散を以下のように定義します。

(とします)
標準偏差は、です。

連続型確率分布の中で、確率密度関数が、

 ・・・@
となるものは、期待値がm,標準偏差がσ(分散は)となりますが、これを正規分布と言い、と表します。
特に、とした
標準正規分布と言います。標準正規分布の確率密度関数は、
です。
確率変数
Xが正規分布に従うとき、確率変数は、@において、とおくことにより、確率密度関数を、
として、標準正規分布に従います。
標準正規分布を考える理由は、教科書その他にの値の表
(「正規分布表」と言われます)が掲載されていて、この表を利用することにより、ほぼ正規分布に従うと見なされる事象について確率を計算することができるからです。
例えば、最初に掲げた収穫されたトマトの重量ですが、それぞれの階級における値を中央値で代表させて平均と分散を求めると、平均は,分散は
(標準偏差は)となります。トマトの重量Xが正規分布に従う、さらには、が標準正規分布に従う、として考えると、に対して、
となり、正規分布表を読むと、 (となる確率) (となる確率)となるので、正規分布として考えたときに、トマトの重量が140g以上180g未満となる確率は、となり、上に述べた確率0.7256と近い値になります。

n回サイコロを投げて1の目が出る回数をXとすると、確率変数Xは、二項分布に従います。右図は、表計算ソフトEXCELBINOM.DIST関数とグラフ機能を用いて、n = 612244896192について、二項分布のグラフを描いたものです。nが大きくなるのに従って、グラフは正規分布曲線に近づいてきます。
nが充分に大きい場合については、二項分布 を近似的に正規分布と考えると、確率変数は標準正規分布に従うので、正規分布表を用いて、確率などを計算することができます。
例えば、
384回サイコロを投げて1の目が出る回数をXとすると、確率変数Xは、二項分布に従います。平均は,分散は,標準偏差はです。
を充分に大きいと考えて、確率変数
Xが正規分布に従うと考え、とおくと確率変数Zは標準正規分布に従うので、1の目が70回以上出る確率は、より、正規分布表ののところを読んで0.2939 (これは平均である64回以上であってかつ70回以下となる確率),よって、 (0.5から引くのは、平均の64回以上出る確率が0.5だからです)として確率を計算することができます。

確率密度関数に関する条件を、正規分布、標準正規分布の場合について、考察しておきます。
積分は、色々と特殊な工夫をして高校の範囲内の知識のみを用いて求めよう、という入試問題は見られますが、一般的方法では、高校の範囲内では求められません。
高校の範囲外ですが、以下のように
重積分を用いて計算する方法が知られています。
原点
4点を4頂点とする正方形Sは、原点を中心とする半径Rの円の (とします)を含んでいて、原点を中心とする半径の円の (とします)には含まれます。従って、S上のの積分は、上での積分よりも大きく、上での積分よりも小さくなります。よって、
とすると、では、 (直交座標系・円筒座標系・球座標系を参照)より、
とおくと、r0Rのとき、u0より、
同様に、では、なので、
また、Sでは、より、
これより、
ここで、とすると、左辺→,右辺→はさみうちの原理より、
よって、は偶関数なので、
とおくと、

 ∴  ・・・A
これより、は、確率密度関数の条件を満たします。
Aにおいて、とおくと、

これより、 ・・・@ は、確率密度関数の条件を満たします。


確率変数
Xが連続な値をとるとき、確率分布を表す曲線(分布曲線)を考え、の定義域をとして、以下のような性質を持つとき、確率分布を連続型確率分布と言う。を特に確率密度関数と言う。
(i) 全区間において
(ii) となる確率:
(iii)
このとき、確率変数Xの平均(期待値)(とする),確率変数Xの分散:,確率変数Xの標準偏差:
連続型確率分布で、確率密度関数が
(定義域は全実数)となるものを、正規分布と言う。平均はm,標準偏差はσ,この正規分布をと表す。
特に、となる正規分布を標準正規分布と言う。標準正規分布の確率密度関数は、
標準正規分布で、
uの値との値(確率になる)との対応表を正規分布表と言う。
確率変数
Xが正規分布に従うとき、確率変数は、標準正規分布に従う。
nが充分に大きいとき、二項分布 を近似的に正規分布と考えることができる。確率変数は標準正規分布に従う。




   数学基礎事項TOP   数学TOP   TOPページに戻る

各問題の著作権は出題大学に属します。
©2005-2021
(有)りるらる
苦学楽学塾 随時入会受付中!
理系大学受験ネット塾苦学楽学塾(ご案内はこちら)ご入会は、
まず、こちらまでメールをお送りください。
 雑誌「大学への数学」出版元