1 主要な8の統計的考え方
統計的手法は、多数の層から成る論理が積み重なっている山のようである。基礎から一歩一歩理解を進めていくためにも、まず、何を目指しているのか、その主要な考え方を見渡そう。
- 統計的思考への社会の要請
- 主要な考え方(1)確率分布
- 主要な考え方(2)最適化
- 主要な考え方(3)人間的制約
0. 統計的思考への社会の要請
要点
『データ・サイエンス』とは、①数理統計学、②コンピュータ・サイエンス、③対象の専門知識から成る学際的な手法群である
よくある誤解
- ビッグ・データがあれば、何でも分かる
- 統計学は専門家が理解していれば十分である
1. 主要な考え方(1)確率分布
要点
- 統計学 = 体系的に観察から理解を導出する概念装置
- 多くの自然・社会現象は、確率分布に従う
- 標本(現象の観察)と仮定を組み合わせて、確率分布を推測する
- 意思決定に役立つ情報とは、確率分布について分別できるものだ
2. 主要な考え方(2)最適化
要点
- 誤差の総和を、偶発誤差と系統誤差に分解できる
- 標本を大量に観察することで、偶発誤差を回避できる
- 標本を無作為に観察することで、系統誤差を回避できる
3. 主要な考え方(3)人間的制約
要点
- 強い仮定を置けば、脆弱だけれど明確な理解が得られる
- 複雑な仮定を置けば、解釈できないが精緻な理解が得られる
参考図書・文献
鳥居泰彦『はじめての統計学』、日本経済新聞出版、1994年
東京大学教養学部統計学教室 『基礎統計学I 統計学入門』東京大学出版会、1991年
竹村彰通『データサイエンス入門』、岩波新書、2018年
濵田悦生・狩野裕『データサイエンス入門シリーズ データサイエンスの基礎』講談社、2019年