代表値

ある一つの属性についてのデータがあるとき、集合Dの要素の個数をデータの大きさと言う。データの総和をデータの大きさで割ったもの、
をデータの平均値と言う。
度数が最も多い階級の階級値を
最頻値(mode)と言う。
データをとなるように並べたときに中央に来る値、つまり、
nが奇数のときは、番目の値nが偶数のときは、番目に来る値と番目に来る値の平均中央値(median)と言う。

データの整理で取り上げたデータを再掲します。
 日最高気温日照時間湿度 日最高気温日照時間湿度 日最高気温日照時間湿度
 121.4071 1127.62.754 2129.311.431
 225.20.967 1223.50.971 2231.96.046
 324.71.467 1326.77.937 2330.08.134
 424.00.371 1425.21.058 2426.27.950
 526.96.457 1526.38.651 2527.38.246
 624.96.553 1627.25.445 2619.80.770
 726.39.644 1725.31.856 2724.910.548
 819.7068 1825.3071 2825.97.047
 928.46.855 1927.611.446 2927.75.748
 1029.78.242 2029.07.838 3027.87.948

30日分の最高気温のデータを、という具合に足していくと、総和は、785.7になります。最高気温の平均値は、
より、26.19℃です。このとき電卓でもあれば、と足していってもよいのですが、暗算では大変です。そこで、仮平均との差の平均を考える、という技巧があります。最高気温の最大値は22日の31.9℃、最小値は8日の19.7℃なので、なので、仮平均を26℃として、各データの26℃との差を

というように足していきます。これなら、暗算でもできないことはありません。平均値は、として求めることができます。入試でも功を奏する技巧です。但し、仮平均の技巧は、日照時間や湿度のようにばらつきが多いデータだとあまり効果はありません。日照時間の平均値は、
より、5.37時間です。湿度の平均値は、
より、53%です。

最高気温の最頻値は、
データの整理で書いたような幅1.5℃の階級では、24.5以上26未満の階級の度数8が最大の度数なので、最頻値は、℃です。
日照時間の最頻値は、度数
9が最大の0以上1.5未満の階級なので、0.75時間です。日照時間の平均時間5.37時間とは大きくずれます。
湿度の最頻値は、度数
10が最大の40以上50未満の階級なので、45%です。

最高気温の中央値は、最高気温を小さい順に並べたとき、
15番目の26.3℃と16番目の平均26.3℃の平均をとり、26.3℃です(上記のデータでは中央に来るものが存在しませんが、データの大きさが奇数なら、ちょうど中央に来るものが存在します)
日照時間の中央値は、日照時間を小さい順に並べたとき、
15番目の6.416番目の6.5の平均をとり、6.45時間です。
湿度の中央値は、湿度を小さい順に並べたとき、
15番目の5016番目の51の平均をとり50.5%です。

平均値、最頻値、中央値のどれがデータの代表値として適当か、ということについては、データの特性にもよります。例えば、日本人
100人の平均年収が400万円と言われても、年収1億円の人が2人いて、残りの98人の年収が200万円であっても平均年収396万円ということになりますが、これは年収の実体を反映しているとは言えません。最頻値や中央値の方が実体を表しているということもあります。



   数学基礎事項TOP   数学TOP   TOPページに戻る

各問題の著作権は出題大学に属します。
©2005-2022
(有)りるらる
苦学楽学塾 随時入会受付中!
理系大学受験ネット塾苦学楽学塾(ご案内はこちら)ご入会は、
まず、こちらまでメールをお送りください。
 雑誌「大学への数学」出版元