2018_データサイエンス

データサイエンス


勉強内容


研究を進めるにあたり,データの前処理や分析,機械学習モデル構築などの基本的な技術を取得する必要がある.本年度からの試みとして,東京大学松尾研究室により作成,公開されている教材をお借りし,勉強会を開催している.


資料


東京大学松尾研究室公開の GCIデータサイエンティスト育成講座演習コンテンツ


スケジュール


1 Jupyter Notebook の基本操作,Python3の基礎
2 データ分析時によく使用されるパッケージ(Numpy,Scipy,Pandas,Matplotlib)の基礎
3 記述統計学,単回帰分析
4 確率の基礎,統計の基礎
5 科学計算の基礎(Numpy,Scipy)
6 データ加工処理(Pandas)
7 データの可視化(Matplotlib)
8 データベース,SQLの基礎
9 PythonとSQLの接続,高度・高速なSQL処理
10 MongoDB
11 教師あり学習
12 教師無し学習
13 モデル検証法,チューニング方法
14 深層学習に必要な知識,Pythonの高速化,Spark入門
15 総合問題