【サブタイトル】 |
データサイエンス入門:統計的データ解析の基礎1 |
【講義の目的・内容】 |
情報連携の各科目群の専門的学習を進めていくうえで重要な基礎知識となるデータサイエンス(確率・統計学)をはじめて学ぶ学生を対象として、その初歩的な考え方と方法を身につけることを目的とする。本講義では、まず私たちにとって身近な統計的データの例を見ながら、日常生活や情報連携の各分野での統計的な考え方やデータ分析の重要性を確認する。続いて、度数分布表やヒストグラムによるデータのまとめ方と記述統計の各指標(平均や分散など)を整理したうえで、確率および確率分布についての理解を深める。さらに、これらの基本概念の理解のもと、標本分布(母集団と標本)と統計的推測(点推定と区間推定)の初歩に触れ、統計的データ解析の基礎を習得する。 |
【学修到達目標】 |
データサイエンスの基本的な考え方を練習問題を解きながら学び、情報連携の各科目群における研究および実践で必要となる統計的データ解析の基礎を身につけることを目標とする。 |
【講義スケジュール】 |
"1.データサイエンスをはじめよう (1)私たちの身のまわりの統計的データ、情報連携と統計的データ解析 ・情報連携におけるデータサイエンスの重要性とおもしろさについて理解する。 ・統計的なデータ分析とはどのようなものかについて実例をみながら概観する。 2.度数分布とは? (2)度数分布の理解と表現、度数分布表とヒストグラム ・得られたデータの分布の様子を表やグラフで把握する方法を学習する。 3.記述統計とは? (3)記述統計のさまざまな指標:中心的傾向 (4)記述統計のさまざまな指標:ばらつき ・得られたデータの特徴を数値の指標でまとめる方法について学習する。 4.確率と確率分布の基礎 (5)確率の基本的考え方・その1(集合、組合わせ、試行と事象) (6)確率の基本的考え方・その2(確率の法則、反復試行) (7)確率分布の紹介・その1(確率変数と確率分布、二項分布) (8)確率分布の紹介・その2(正規分布、標準正規分布) (9)確率分布の紹介・その3(正規分布の標準化) ・統計的な考え方の基礎となる確率の概念と確率分布についてその基本を学ぶ。 5.母集団と標本 (10)調査対象とサンプルの関係、標本分布 (11)母数と観測データの関係、標本平均の分布、t分布 ・調査対象全体(母集団)とそこから抽出された標本(サンプル)の関係について理解する。 6.統計的推測の考え方 (12)統計的推測とは? 母数の推定(点推定と区間推定) (13)区間推定(母分散が既知の場合) (14)区間推定(母分散が未知の場合) ・標本の観測値(統計量)から母集団の特徴を表す数値(母数)を推測する方法と考え方を理解する。 ・統計的推測の代表的手法である推定(点推定、区間推定)についてその基礎を学ぶ。 7.試験 (15)期末テスト" |
【指導方法】 |
授業は講義形式でおこなう。講義内容の理解を深めるためのレポート課題(練習問題)への回答作業も授業中におこない、毎週の授業時間内に提出する。 |
【事前・事後学修】 |
|
【成績評価の方法・基準】 |
最終成績は授業参加度(出席)、毎週のレポート課題の提出状況、期末テストの得点を総合的に考慮して評価する。 |
【受講要件】 |
"2019年度以降の入学生は、数学IAと数学IIBCの両方の学力テストに合格していないと以下の科目を履修できません。 「情報連携のための数学A・B」(~2021年度入学生用) 「情報連携のための数学I・II」(2022年度〜入学生用) 「情報連携のための確率・統計学A・B」(~2021年度入学生用) 「情報連携のための確率・統計学I・II」(2022年度〜入学生用)
ただし、2025年度入学生については、4月の数学IAと数学IIBCの学力テストのどちらか(あるいは両方)で不合格の場合でも、2025年度春学期の「情報連携のための確率・統計学I」を履修することは可能とします。その場合でも、単位を取得するためには、不合格となった数学IAや数学IIBCについて春学期中に実施する再テストに合格することを前提とし、再テスト後にどちらかでも不合格だった場合には履修自体を取り消します。" |
【テキスト】 |
『はじめての統計学』道家暎幸,伊藤真吾,宮﨑直,酒井祐貴子(著),コロナ社. |
【参考書】 |
"たとえば、 『統計学入門』東京大学教養学部統計学教室(編),東京大学出版会. 『データの分析』日本統計学会(編),東京図書. 『統計学基礎』日本統計学会(編),東京図書. など。" |
【関連分野・関連科目】 |
|
【備考】 |
|
【添付ファイル1】 |
【添付ファイル2】 |
【添付ファイル3】 |
【リンク】 |
|