不透明な時代を見抜く「統計思考力」/神永正博

統計思考力として、物事を誰かの意見を鵜呑みにするのではなく、実際のデータに当たることの重要性、そしてその方法を解説した本。
データにあたることの重要性、人の意見ではなく、データからの分析を行うことが、論理的な結論を出すためにいかに大切かを説く。

基礎編においては、生データに当たることの重要性を主に説いており、例として、若者が読書離れしている、ということが本当であるかという点について、インターネットの普及率との関係や、大学生に対するアンケート結果等、当たるべきデータを示した上で、若者が本を読むことをやめたのではなく、大学にそもそも本を読まない層が入学するようになったことからそう見えるのではないかと結論付ける。
次に、小泉改革は格差を拡大したか、という問いに対して、格差を定義するためにジニ係数ローレンツ曲線を使用し、生データからの分析を行っている。さらに、航空機事故や地震が近い期間に複数回発生することについて、事故は流行るか、という問いをたて、ポアソン分布をもとに説明を行う。

こうして、世の中の言説が印象や単一のデータを見た結果から言われており、本来多面的に見ることが重要であることを指摘している。データをまとめられた意見ではなく生データにあたること、さらにその際、どういうデータがあれば、どういう結論になるか、を意識することが重要となる。

中級編においては、生データを統計学の手法によって加工する手法を説明する。
紹介される手法は平均。使う際の注意点は以下のとおり。

  • 少ないサンプルだと意味が無い。
  • 質の異なるデータが混ざっている場合は注意。

分布。

  • 極端なことのおきやすさ、パレート指数。
  • 極端な差が出やすい分布、べき分布。:べき分布には平均、分散がないこともある。
  • 周期が無くてもそう見える、ユール=スルツキー効果。
  • 独立的な事象が多く存在すれば正規分布

標準偏差

  • 平均からの距離の集まり。
  • 絶対値でとるのは平均偏差。

上級編においては、データを扱うことによって、未来を予測する等、実際に利用することを説明する。
経済は、ブラックスワンがあり得ること等、未来を予測することは難しい。しかし、人口についてはかなり正確に予測が可能であり、将来の見通しをたてるに当たって重要な学問だとし、人口に関連する統計を紹介する。


<目次>
第1章 基礎編 データを見る

  1. 生データを入手する
  2. データを図にする
  3. 専門外のデータはこうして読もう

第2章 中級編 データを読む

  1. 基本をおさえるー平均と分散
  2. 足したら出てくる正規分布
  3. 一を聞いて十を知るー大数の法則
  4. 分けて考えるべき分布
  5. 因果関係と間違えるなー相関

第3章 上級編 データを利用する

  1. 未来を予測する
  2. 思考を練習する
  3. 自力で考えることの最大の敵