【サブタイトル】 |
機械学習法によるデータ解析 |
【講義の目的・内容】 |
大量のデータを解析するための強力な手法である「機械学習法」を中心に、各方法の動作原理、分類・数値予測器を構築する方法などを学ぶ |
【学修到達目標】 |
各方法の動作原理を理解し、自分の問題にどの方法が適しているかを判断できる。サンプルプログラムの内容を把握し、方法とPythonプログラムの対応関係を理解する。自分のデータに対してプログラムを適用できる・自分でプログラムの間違いをみつけて修正できる。プログラムを変更して機能変更・拡張ができる。 |
【講義スケジュール】 |
"01. イントロダクションと作業環境の確認、numpy/pandas/可視化の復習 02. 統計的推定 03. 統計的検定 04. 線形回帰 05. クラスタリング・基礎 06. クラスタ分析・応用 07. 予測精度評価 08. 前半まとめ、中間試験 09. サポートベクターマシン・基礎 10. サポートベクターマシン・応用 11. ハイパーパラメータ最適化 12. ランダムフォレスト・基礎 13. ランダムフォレスト・応用, その他のアンサンブル学習 14. 最適化 15. 後半まとめ、期末試験" |
【指導方法】 |
座学+ハンズオンの組み合わせ。座学で方法の原理と概要を理解し、サンプルプログラムでその実現方法を理解する。サンプルプログラムをもとに、別のデータに対する解析を行うプログラムを作成し、またプログラムの変更、機能拡張などに取り組むことで、理解を深める。 |
【事前・事後学修】 |
MOOCsによる事前学習が必須である。講義後には、理解度が低かったトピックや課題の復習を十分に行い、次回講義の小テストで理解度を確認する。 |
【成績評価の方法・基準】 |
受講態度、複数回の試験、各回冒頭の理解度確認小テスト、課題等の提出、講義への積極的な取り組みを総合的に評価する。 |
【受講要件】 |
ハンズオンでは、JupyterLab上でnumpy/pandas/matplotlib/sklearnなどのライブラリを利用するPythonプログラムを扱うので、2年次「コンピュータ・サイエンス概論III」「コンピュータサイエンス演習III」で習った内容をよく復習しておくこと。また2年次「データサイエンス基礎」「データ・マイニング論」「データサイエンス演習I, II」、3年次 「データサイエンス演習III」と要素技術が相互に関連しあうことが多いので、受講しない/していない場合はMOOCsなどを活用して自学自習することを強く推奨する。 |
【テキスト】 |
なし |
【参考書】 |
講義の中で適宜紹介する |
【関連分野・関連科目】 |
コンピュータ・サイエンス概論III、コンピュータサイエンス演習III、データサイエンス基礎、データ・マイニング論、データサイエンス演習I~IV、ディープラーニング |
【備考】 |
|
【添付ファイル1】 |
【添付ファイル2】 |
【添付ファイル3】 |
【リンク】 |
|