Aidemy 10周年

AIプログラミング学習サービス「Aidemy」、新コース「機械学習におけるデータ前処理」を開設

– DBからのデータ取得、欠損値の対応、不均衡データの調整 –

東大発スタートアップの株式会社アイデミー(本社:東京都文京区、代表取締役CEO 石川聡彦)が提供するAIプログラミング学習サービス「Aidemy」(https://aidemy.net/)は、2018年9月27日(木)より、新たに「機械学習におけるデータ前処理コース」の提供を開始しましたのでお知らせいたします。

「機械学習におけるデータ前処理コース」概要
本コースでは、Pythonで機械学習を行う際に必要となる様々な前処理を学びます。CSV・Excel・DBからのデータの取得、欠損値への対応方法、不均衡データの調整方法、データのスケール調整や、縦持ち横持ち変換など、実務で必須となる前処理をスマートに実装するためのライブラリ(pandas、scikit-learn、statsmodels、imbalanced-learn、scipyなど)についてコード例を確認しながら習得が可能です。

「機械学習におけるデータ前処理コース」詳細
本コースでは、下記の4つの項目を重点的に学習できます。

1. データ分析プロセスと前処理
データ分析のプロセスには、CRISP-DMとKDDの2つがあります。それぞれのプロセスについて理解し、このプロセスを踏まえた上でデータの前処理について学習していきます。

2. DBからデータを取得
sqlalchemyモジュールを用いてDBに接続し、pandasのread_sql関数によりDataFrame形式でデータを取得してテーブルの結合やグループ化をする方法を学習します。

▲「機械学習におけるデータ前処理コース DBからのデータ読み込み」の画面▲

▲「機械学習におけるデータ前処理コース DBからのデータ読み込み」の画面▲

 

3. 欠損値への対応方法、不均衡データの調整方法
欠損値が発生するメカニズム、外れ値・不均衡データによって起こる問題を説明し、それぞれの対処方法を様々なモジュールを用いて学習します。

4. 連続値とデータスケールの変換
例えば、データにおいて10代、20代、30代のように何十代であるかが重要である場合どのようにカテゴリ化していくのか、また、他のデータと比較して相対的に大きな値が含まれるデータが存在するとき、データの大きさを一定の基準に収まるようにスケール調整をする方法を学習します。

■価格
3,980円(税込)

■お申し込み
機械学習におけるデータ前処理コースお申し込みページ(https://aidemy.net/courses/8000)よりお申し込みください。

プレスキットはこちら