データサイエンス
勉強内容
研究を進めるにあたり,データの前処理や分析,機械学習モデル構築などの基本的な技術を取得する必要がある.本年度からの試みとして,東京大学松尾研究室により作成,公開されている教材をお借りし,勉強会を開催している.
資料
東京大学松尾研究室公開の GCIデータサイエンティスト育成講座演習コンテンツ
スケジュール
回 | 章 |
---|---|
1 | Jupyter Notebook の基本操作,Python3の基礎 |
2 | データ分析時によく使用されるパッケージ(Numpy,Scipy,Pandas,Matplotlib)の基礎 |
3 | 記述統計学,単回帰分析 |
4 | 確率の基礎,統計の基礎 |
5 | 科学計算の基礎(Numpy,Scipy) |
6 | データ加工処理(Pandas) |
7 | データの可視化(Matplotlib) |
8 | データベース,SQLの基礎 |
9 | PythonとSQLの接続,高度・高速なSQL処理 |
10 | MongoDB |
11 | 教師あり学習 |
12 | 教師無し学習 |
13 | モデル検証法,チューニング方法 |
14 | 深層学習に必要な知識,Pythonの高速化,Spark入門 |
15 | 総合問題 |