データサイエンス
勉強内容
研究を進めるにあたり,データの前処理や分析,機械学習モデル構築などの基本的な技術を取得する必要がある.本年度からの試みとして,東京大学松尾研究室により作成,公開されている教材をお借りし,勉強会を開催している.
資料
東京大学松尾研究室公開の GCIデータサイエンティスト育成講座演習コンテンツ
スケジュール
| 回 | 章 |
|---|---|
| 1 | Jupyter Notebook の基本操作,Python3の基礎 |
| 2 | データ分析時によく使用されるパッケージ(Numpy,Scipy,Pandas,Matplotlib)の基礎 |
| 3 | 記述統計学,単回帰分析 |
| 4 | 確率の基礎,統計の基礎 |
| 5 | 科学計算の基礎(Numpy,Scipy) |
| 6 | データ加工処理(Pandas) |
| 7 | データの可視化(Matplotlib) |
| 8 | データベース,SQLの基礎 |
| 9 | PythonとSQLの接続,高度・高速なSQL処理 |
| 10 | MongoDB |
| 11 | 教師あり学習 |
| 12 | 教師無し学習 |
| 13 | モデル検証法,チューニング方法 |
| 14 | 深層学習に必要な知識,Pythonの高速化,Spark入門 |
| 15 | 総合問題 |
