HOME>ビジネス知識>「平均値」「中央値」「最頻値」の違い

ビジネス知識

「平均値」「中央値」「最頻値」の違い

「平均値」「中央値」「最頻値」の違い

平均値、中央値、最頻値の違いとは

データの指標となる言葉に、「平均値」「中央値」「最頻値」というものがあります。このうち平均値についてはよく聞きますが、中央値や最頻値は、聞いたことはあっても意味は分からないという人も多いでしょう。ただ、データを見たり扱ったりするにあたっては、知っておいた方がいい言葉なのは間違いありません。そこで今回は、これら3つの言葉の違いについて、詳しく解説していきます。

平均値とは

平均値とは、あるデータのすべての合計を、それらを構成する個数で割った値を言います。

平均値はさまざまなところで使われていますが、代表的なのは、学校などのテストでしょう。平均値を出すことで、全体的な得点レベルを表すことができ、他の科目との比較が容易になるなどのメリットがあります。

その一方で、平均値には不便な点もあります。全体を一律に均した値であることから、必ずしも正しい実態を表しているわけではないということです。具体的には、全体の傾向から外れた極端な値が混じっていた場合、その影響を大きく受けてしまいます。
例えば、数世帯の貯蓄額の平均を求める時、そのうち1世帯の貯蓄がずば抜けて高かった場合は、それに引きずられて平均貯蓄額が上がってしまうことになります。これは、決して正確な実態とは言えません。

こうした点を踏まえた上で、以下で中央値との違いを見てみましょう。

中央値とは

中央値とは、データを最小値から最大値まで順番に並べた際、中央に位置する値のことを言います。データの数が奇数の場合は、ちょうど真ん中にくる値で、偶数の場合は、中央2つの値の平均を中央値と呼びます。

中央値を用いるメリットは、データの分布に歪みがある際でも、実態に即した数字が得やすいという点にあります。上記のような貯蓄額のデータで考えると、1世帯だけ飛びぬけた値があったとしても、平均値とは違い、それに左右される心配がありません。単純に、全体での真ん中の数字を抽出することができますから、より実態に近いデータが得られます。

一方、最頻値との違いは、以下のようになっています。

最頻値とは

最頻値(さいひんち)とは、文字通り、データの中で最も頻繁に現れる値を言います。モードや並数という名前でも呼ばれます。

これも貯蓄額のデータで例えましょう。貯蓄100万円未満から4000万円以上までの世帯割合を、一定の額ごとに区切って並べた際、最も多い割合を示した層が100万円未満だったとします。すると、その100万円未満の層が最頻値となるわけです。

最頻値は、度数分布で使われる指標です。度数分布とは、集めたデータを複数の階級に区分して、表にしたものを言います。度数分布や最頻値をチェックすることで、中央値や平均値とは違い、データのより詳しい内実を知ることができます。