仕事に使える統計学

統計学ってどんなイメージですかね?

難しそうとか?分けわからない?とかそんなイメージですかね。

読んでみて思うのは、確かに難しい(笑)。

だからこそ知っていると知らない人では大きな差が出る。

読むと読まないとでは大違いということです。

大リーグのオークランド・アスレチックスというお金ないチームが統計学のデータを駆使して強くなったのは有名です。

この頃人気が出ている統計学の本をお勧めしたいと思います。

データに意味を持たせる代表値

 
データだけあってもそれが何を意味しているのか分からないと思います。
 
例えば残業が10時間、20時間、15時間、10時間、12時間、16時間。
 
これでは意味が分かりません。ただ、平均残業時間が13.8時間となっていればこの集団は残業時間が13.8時間なんだなと直ぐに分かります。
 
また、代表A会社では平均残業時間が10時間、B会社では平均残業時間が50時間となっていればBやばそうと直ぐわかる。
 
30時間、100時間、70時間、15時間・・・と数字が並んでいても一瞬で見抜けません。
 
代表値は便利なのです。

勘違いしやすいデータ

 
二人以上の世帯での平均貯蓄額は1812万、中央値1016万、最頻値は100万未満。
 
まず図をみて下さい。これ見てどう思いますか?
 
(総務省のHPからグラフはとっています、総務省は自由に使っていいですがいつのものかと出どころを書いてねとなっています、結構データ面白いのでいろんなものを見ると面白いですよ)
 
 
 
 
みんなこんなに貯蓄しているの?と思いますよね?
 
平均、アベレージの弱点が外れ値。極端に年収が多い人がいると平均値が上がってしまう。
 
そこで中央値といって並べていき丁度真ん中をとることをします。外れ値に強い。
 
ただ、これでも漏れていて最頻値、一番出てくる階級を見てみると100万未満が一番多い。
 
このような数値を知っておくと平均貯蓄額1812万があまり全体を反映していないんだなというのが分かります。
 

もう一つの例

 
もっと分かり易くもう一つ例を出しますね。
 
お小遣いを例にします。小学生5人の一週間のお小遣いがあるとします。
 
並べると100円、200円、100円、100円、10000円。
 
これの平均は2100円。
 
中央値は、100円、100円、100円、200円、10000円と並べますからど真ん中の100円。
(偶数の場合は中央の二つを足して2で割る)
 
最頻値も3人いますから100円となります。
 
簡単に言えば10000円という外れ値の子がいると平均が2100円になって他の4人の子は、え?それが平均となるの?となると思います。平均貯蓄額も同じ原理です。
 
今までは平均を見ればそれが代表かなと思っていましたがもっと詳しくみないと本質はみえてこないというのが分かります。
 

バラツキ度合い

 
平均値をみただけだと本質が見えてこない。
 
バラツキ度合いまでチェックしないと本質が見えてこないと思います。
 
例えば
  1. 50点、50点、50点、50点、50点=平均50点
  2. 10点、20点、40点、100点、80点=平均50点
  3. 30点、40点、40点、40点、100点=平均50点

これ全く違いますよね。

バラツキ度合いを見るのに標準偏差という数字を使います。

エクセルで計算させればいいだけなので簡単です。

  1. の標準偏差は0
  2. の標準偏差は35
  3. の標準偏差は25

となりました。(実際は数字はもっと細かい、34.975とかです)

今回は数が少ないので直ぐにわかりますが資料などに平均値だけじゃなく標準偏差の値も付け加えてもらえると、どの程度ばらつきがあるのかが分かってより正確に本質を見抜けます。

統計学

このように統計学をかじるだけで騙されずに数字を多角的に見れるようになります。

すみません、まだまだいろいろあり過ぎて書ききれません。

統計学とは

  • 記述統計学(全データを調べるグラフ化、平均、分散)
  • 多変量解析(2つ以上の変量データを扱う)
  • 推測統計学(一部のサンプルから推測、推定、仮設検定)
  • ベイズ統計学(主観的確率、人間の経験も取り入れる)

このような感じになります。

本書に載っているのは、記述統計学、推測統計学が主です。

推測統計学などは、分かれば一部のサンプルでどれだけの確率というのが分かりビジネスでもかなり使えるんじゃないでしょうか。

題が仕事に使える統計学ですからね。

オークランド・アスレチックスの話

大リーグのオークランド・アスレチックスは、資金が無くてホームランバッターを獲得できない。

そこでチームのGMビリー・ビーンは、勝つためにはどうしたらいいか?得点を取る為にはどうしたらいいか?をデータを洗い直し、統計学的な手法を使ったと言われています。

盗塁、バント、打率など評価基準を決め、出塁率を重視するようにしたところヤンキースなどの強豪球団にも負けないチームを作ることを実証しました。

無死一塁のときは、ファーボールを狙うという戦法も取り入れていたと言われています。

まとめ

この本を読んで統計をかじっておくと便利な特徴。

統計を少し見ただけで
  • 数字の本質を見抜く力がつく(数字を鵜呑みにしてはいけない)
  • どの程度の調査でどの程度の確率性があるか分かる
  • わずかなヒントから大本を推測できる
  • 上司に対抗できる(笑)、感ではなく論理的に数字を出して話せる

推測での確率って大きいですよ、余計な時間を使わなくて済みますし。

そもそも数字の本質を見抜けなく勘違いしたら完全に間違いますし。

統計学は便利な考え方なのでガチでやるのは難しいですがさらっておくだめでも差がつきます。

できるビジネスマンには必衰でしょうね。

ABOUTこの記事をかいた人

現在書店員。ジャンルは、ほぼどのジャンルも経験ありますがビジネス書の担当することが多いです。 本は人生を変え、世界を変えると思っています。 単純に知ることが本当に楽しいです。