検索したい科目/教員名/キーワードを入力し「検索開始」ボタンをクリックしてください。
※教員名では姓と名の間に1文字スペースを入れずに、検索してください。
令和元年度以前入学者 | データ科学2 | ||||
---|---|---|---|---|---|
平成28年度以前入学者 | 情報学要論2 | ||||
教員名 | 尾崎知伸 | ||||
単位数 | 2 | 学年 | 3 | 開講区分 | 文理学部 |
科目群 | 情報科学科 | ||||
学期 | 前期 | 履修区分 | 選択必修 |
授業の形態 | オンライン同時双方向型(Zoomによるライブ中継) + 一部課題研究(Blackboardを通じた学習資料配信) BlackboardコースID : 水曜5限→20213036 |
---|---|
授業概要 | データ科学・データマイニングの基礎的な手法(クラスタリング,分類,相関ルール分析)に関して講義を行う |
授業のねらい・到達目標 | 対象とする要素技術の基本的な考え方を理解し,説明できる. 分析ツールを用い,データの整形,手法の適用,結果の検証を含めた一連の分析ができる. この科目は文理学部(学士(理学))のディプロマポリシーDP6及びカリキュラムポリシーCP9に対応している。 |
授業の方法 | 授業の形式:【講義】 電子資料を用いた講義形式を中心とし,随時,分析ツールを用いた演習を行う. 提出されたレポートについては,その採点結果を開示する.また特に優れたレポートを紹介する. |
履修条件 | 「データ科学1」の内容を修得していることが望ましい |
授業計画 | |
---|---|
1 |
ガイダンス(授業のテーマや到達目標及び授業の方法について説明する) データマイニング手法の外観 【事前学習】シラバスを事前に確認する.当該分野に関する簡単な調査を行う (2時間) 【事後学習】データマイニングの概要と知識発見のプロセスを中心に復習をする (2時間) |
2 |
クラスタリング:階層的クラスタリング
【事前学習】階層的クラスタリングに関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】クラスタリングの基本的な考え方と階層的クラスタリングの原理を中心に復習をする (2時間) |
3 |
クラスタリング:非階層的クラスタリング
【事前学習】非階層的クラスタリングに関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】非階層的クラスタリングの原理と具体的な動作プロセスを中心に復習をする (2時間) |
4 |
クラスタリング:クラスタリングの性能評価
【事前学習】性能評価に関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】性能評価の考え方と発展的なクラスタリング手法を中心に復習をする (2時間) |
5 |
クラスタリング:第2回~第4回までの内容を振り返り,理解を深める
【事前学習】第2回~第4回を振り返り,内容の整理を行う (2時間) 【事後学習】第2回~第4回の内容に関するレポートに取り組む (2時間) |
6 |
分類学習:決定木の学習アルゴリズムの導入
【事前学習】決定木の概要に関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】決定木分析の基本的な考え方を中心に復習をする (2時間) |
7 |
分類学習:決定木の学習アルゴリズムの発展
【事前学習】決定木の学習に関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】分割基準を中心に決定木構築アルゴリズムの詳細について復習をする (2時間) |
8 |
分類学習:分類器の性能評価
【事前学習】決定木の性能評価に関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】検定を含め,性能評価の考え方とその方法を中心に復習をする (2時間) |
9 |
分類学習:アンサンブル学習
【事前学習】アンサンブル学習に関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】アンサンブル学習の原理を中心に復習をする (2時間) |
10 |
分類学習:第6回~第9回までの内容を振り返り,理解を深める
【事前学習】第6回~第9回を振り返り,内容の整理を行う (2時間) 【事後学習】第6回~第9回の内容に関するレポートに取り組む (2時間) |
11 |
相関ルール分析:頻出パターン
【事前学習】頻出パターンに関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】相関ルール分析の基本的な考え方と頻出パターンと相関ルールの役割を中心に復習をする (2時間) |
12 |
相関ルール分析:相関ルール
【事前学習】相関ルールに関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】相関ルール導出アルゴリズムを中心に復習をする (2時間) |
13 |
相関ルール分析:相関ルールの評価
【事前学習】相関ルール評価に関する配布資料を通読し,内容を簡単にまとめる (2時間) 【事後学習】種々の評価基準に対する考え方を中心に復習をする (2時間) |
14 |
相関ルール分析:第11回~第13回までの内容を振り返り,理解を深める
【事前学習】第11回~第13回を振り返り,内容の整理を行う (2時間) 【事後学習】第11回~第13回の内容に関するレポートに取り組む (2時間) |
15 |
これまでの復習を行い授業の理解を深め,今後の発展について検討する
【事前学習】これまでの学修内容を振り返り,内容の整理を行う (2時間) 【事後学習】これまでの学修内容を振り返り,どの様な発展が考えられるか考察する (2時間) |
その他 | |
---|---|
教科書 | なし(電子資料配布) |
参考書 | Peter Bruce,Andrew Bruce(著),黒川 利明(訳),大橋 真也(技術監修) 『データサイエンスのための統計学入門 ――予測,分類,統計モデリング,統計的機械学習とRプログラミング』 オライリー・ジャパン 2018年 第0版 金明哲 『Rによるデータサイエンス』 森北出版 2017年 第2版 山本義郎,藤野友和,久保田貴文 『Rによるデータマイニング入門』 オーム社 2015年 元田 浩, 山口 高平, 津本 周作, 沼尾 正行 『データマイニングの基礎』 オーム社 2006年 その他の参考文献に関しては,授業中に適宜,指定する |
成績評価の方法及び基準 | レポート:クラスタリング・分類学習・相関ルール分析それぞれに関する実験レポートと授業内容の振り返りレポートを用いて評価する.(70%)、授業参画度:講義中に行う実習・演習の成果により評価する.(30%) ・レポート未提出の場合はE判定とする |
オフィスアワー | 質問等は随時を受け付ける.原則,事前にメール等でアポイントをとること |