《基 本 統 計 学 19》
●標準正規分布について データの標準化 データ 標準化データ ------------ ------------------- x1 z1 x2 z2 : データの標準化(z変換) : : -----------------------→ : : xi−m : xn zi=------------ zn Std m = 平均値 Std=標準偏差 標準化したデータを用いて作成された正規分布を「標準正規分布」という。 標準正規分布の分布表(標準正規分布表」の特徴は 平均値=0 分散(標準偏差)=1 この標準正規分布表を、z値毎に表にまとめたものを、「標準正規分布表」という。
上表を、z軸を横軸に表したグラフが標準正規分布で、z=0の線対称分布図になります。z≧0の部分の面積が50% を占めます。また、z≦0の部分の面積が50%を占めることになります。 例1 ある学校で体重測定を実施したところ、体重の平均値は58Kgで、標準偏差は3.0Kgであった。 このデータが正規分布に従うと仮定して、体重64Kg以上の生徒は全体で何%いるか、求めなさい。 解 データ ----------- 平均値 =58 標準偏差=3.0 データの標準化 与えられた値 64Kg -----------------→ 標準化された値 z=2 =(64−58)/3 z=2の場合の標準正規分布表値は、0.4772と読み取れる。 従って、64Kg(z=2)以上の標準正規分布が占める面積は、0.5−0.4772=0.0228となる。 よって、体重64Kg以上の生徒は、0.0228×100=2.28、約2.28%いることがわかる。 例2 例1において、体重が50から60Kgの生徒は、全体でなん%いるでしょうか、求めなさい。 解 normsdist(z)関数は、標準正規分布において、−∞〜zまでの面積(全面積1に対する)を表している。 体重50Kg z1=-2.66667 --------------------→ 体重60Kg 標準化 z2=0.66667 −∞からz1=−2.66667までの面積 = 0.00383 −∞からz2=0.66667までの面積 = 0.747507 従って、体重50Kg(z=-2.66667)から60Kg(z=0.66667)の標準正規分布が示す面積は。0.747507−0.00383=0.74368 であるので、その範囲に属する生徒は、全体で0.74368×100=74.37%であることがわかる。 例3 学生1000人の身長の平均値は152cmで、標準偏差は4cmであった。 なお、データは、正規分布に準拠しているものとする。 1)身長148cmから155cmの学生数を推計しなさい。 2)身長152cm以上の学生数を推計しなさい。 3)身長149cm以下の学生数を推計しなさい。 解 関数normsdist(z)は、標準正規分布において、−∞からzまでの面積(全面積1に対する)を表している。 表 --------------- 標本数 1000 平均値 152 標準偏差 4 ---------------- 1) 標準化データ 身長 148 z1=−1 ----------------------→ 身長 155 標準化 z2=0.75 標準正規分布において −∞からz1=−1までの面積=0.158655 ←----- =normsdist(-1) −∞からz2=0.75までの面積=0.773373 ←----- =normsdist(0.75) 従って、148cm(z1=-1)から155cm(z2=0.75)までの面積は、0.773373−0.158655=0.614717であるので 全体の0.61472×100=61.472%となる。 よって、求めるその範囲の人数は、1000×0.61472≒615名となる。 2) 身長 158cm ------------→ z=1.5 標準化 標準正規分布において −∞から158cm(z=1.5)までの面積=0.933193 ←-------- =normsdist(1.5) 従って、158cm以上の面積は、1−0.933193=0.066807であるので、その範囲の面積は全体の100×0.066807=6.68% となるので、求める範囲に入る人数は、1000×0.0668≒67人と推定できる。 3) 身長 149cm -----------→ z1=−0.75 標準化 求める範囲は、−∞からz=−0.75までの標準正規分布上の面積範囲であるので、その面積は0.2267(=normsdist (−0.75))であるので、0.227×100=22.7%となる。 従って、その範囲に入る人数は、1000×0.227=227人と推計できる。 詳細は下図を参照 ![]()