【サブタイトル】 |
データサイエンスの基礎を学ぶ |
【講義の目的・内容】 |
"現在のビッグデータ時代においては、分野に問わずあらゆるところで、蓄積されたデータを解析し、未来の見通しや意思決定のための必要な情報を得る「データサイエンス」が必要不可欠になっている。本講義では、1年次から学習してきたPythonプログラミングを活用して、データを正しく処理し、有用な情報を適切に引き出して、各自が学ぶ専門分野に応用するために必要なデータサイエンス技術の基礎を学ぶ。以下のトピックについて、コンピュータ・サイエンス演習IIIと併せて、座学とともに実際に手を動かしてプログラミングを行いながら理解を深める。
・numpy, pandas, matplotlibなどのPythonライブラリを用いたデータ解析と可視化 ・統計解析、機械学習、深層学習など、データサイエンスの基礎技術の原理とプログラミング" |
【学修到達目標】 |
"本講義では、以下の修得を目標とする。 ・Pythonプログラミングを用いたデータの解析と可視化が自分で行えるようになること。 ・統計解析、機械学習、深層学習などのさまざまな基礎技術の原理を理解すること。またこれらのサンプルプログラムの内容を理解し、自分の問題に合わせて正しく改変または新規作成・実行できるようになること。" |
【講義スケジュール】 |
"01. ガイダンス、作業環境の確認、numpy, pandas 02. データの読み込みと前処理 03. データの把握、可視化 04. データの加工・抽出、クレンジング 05. データの集計、時系列データの解析 06. 散布図とクラスタリング 07. 相関と線形単回帰分析 08. 前半のまとめと中間試験 09. その他の線形回帰分析 10. 画像データの取り扱い、機械学習基礎とニューラルネットワーク 11. 予測精度評価、ニューラルネットワークのプログラミング 12. ファイルとディレクトリ操作、RFC 13. RFR、深層学習基礎とCNN 14. CNNのプログラミング 15. 後半のまとめと期末試験 " |
【指導方法】 |
"対面講義を基本とするが、状況によっては遠隔授業(同時双方向型授業)を組み合わせたハイブリッド形式とする。 座学+ハンズオンの組み合わせ。座学で方法の原理と概要を理解し、サンプルプログラムでその実現方法を理解する。" |
【事前・事後学修】 |
MOOCsによる事前学習が必須である。講義後には、理解度が低かったトピックや課題の復習を十分に行い、次回講義の小テストで理解度を確認する。 |
【成績評価の方法・基準】 |
受講態度、複数回の試験、各回の理解度確認小テスト、課題提出、講義への積極的な取り組みを総合的に評価する。なお、スキルの習得が主要な目的の1つであるため、十分なスキルが身についていることが確認できない場合に、それ以外の項目で埋め合わせて単位を取得することはできない。 |
【受講要件】 |
|
【テキスト】 |
各回の講義に対応したMOOCs教材を事前に提供する。 |
【参考書】 |
必要に応じて講義の中で紹介する |
【関連分野・関連科目】 |
"コンピュータ・サイエンス演習III コンピュータ・サイエンス概論I, II、コンピュータ・サイエンス演習I, II 確率・統計I, II 数学I, II" |
【備考】 |
|
【添付ファイル1】 |
【添付ファイル2】 |
【添付ファイル3】 |
【リンク】 |
|