【サブタイトル】 |
データサイエンス基礎 |
【講義の目的・内容】 |
データサイエンスの基礎として、記述統計学、推測統計学の代表的な手法について、主にpythonで適用できるようになることを目指す。具体的には、前半で主に確率分布と区間推定について、後半に各種の仮説検定、多重比較および分散分析を学習する。 |
【学修到達目標】 |
"・統計学の基本的な考え方を理解し、pythonを用いて適用できるようになる ・各種仮説検定の手法(二項検定、フィッシャーの正確検定等)の内容と適用シーンを理解する ・一元配置分散分析、二元配置分散分析を理解する" |
【講義スケジュール】 |
"第1回 確率の復習、条件付き確率とベイズの定理 第2回 確率分布、確率変数の期待値と分散、モーメント、標準化、チェビシェフ不等式 第3回 離散型の確率分布(二項分布、ポアソン分布、超幾何分布) 第4回 連続型の確率分布(正規分布、指数分布、t分布) 第5回 統計的推定、最尤推定 第6回 Pythonによる母平均の区間推定 第7回 仮説検定の考え方 第8回 まとめと試験(1) 第9回 平均の検定 第10回 平均の差の検定 第11回 そのほかの検定統計量の分布(F分布、カイ二乗分布)、様々な仮説検定(二項検定、適合度検定、独立性の検定) 第12回 一元配置分散分析 第13回 多重比較 第14回 二元配置分散分析 第15回 まとめと試験(2)" |
【指導方法】 |
座学による講義を中心とするが、講義内で適宜演習問題への取り組みを導入し、また簡単なサンプルコード等を用いることで理解の定着を図りながら進めるため、パソコンは常に持参のこと。各回の講義前半において前回の内容と課題の振り返りを行う。 |
【事前・事後学修】 |
各回の予習を前提とする。資料、サンプルコードを用いて事前学習を行って頂きたい。また授業後は、課された課題および資料、サンプルコードを用いた復習を行って頂きたい。取り組み時間は予習、復習各1時間程度を目安とする。 |
【成績評価の方法・基準】 |
試験(中間含む複数回)の結果、課題の提出状況、受講態度に基づき総合的に判定する。 |
【受講要件】 |
なし |
【テキスト】 |
特に指定しない |
【参考書】 |
"西内啓「統計学が最強の学問である」ダイヤモンド社 西内啓「統計学が最強の学問である[実践編]」ダイヤモンド社 西内啓「統計学が最強の学問である[ビジネス編]」ダイヤモンド社" |
【関連分野・関連科目】 |
"「情報連携のための確率・統計学I/II」 「DS演習I/II」" |
【備考】 |
|
【添付ファイル1】 |
【添付ファイル2】 |
【添付ファイル3】 |
【リンク】 |
|