予測モデルのスコア1位!データ分析人材育成プログラム無事修了

予測モデルの精度を表す評価指標RMSEが32以下で合格

kaoru · 2021.02.28

データ分析人材育成プログラム修了

3年目の講座は、全てオンラインで行われた。合格の基準は、予測モデルの精度を表す評価指標のRMSE(予測値との誤差)が32以下(誤差が低いほど正解率は高い)を得点すること。予測モデルを作成して、予測した値をSIGNATEへ投稿すると、精度の高い順にランキング表示される。今回の講座で作成した予測モデルで予測した結果は、RMSE9.76でスコア1位を獲得することができた。チームごとのアイディアソンでも、4チーム(1チーム5名)の中から最優秀賞に選ばれるなど、メンバーと試行錯誤して取り組んだ結果が評価された。総合的な良い成績のお陰で、修了証の授与式へ代表参加者に選んでいただき、大変光栄に思っていたのだけれど、自粛要請により授与式の開催は中止となってしまった。


オンライン修了式

— バーチャル修了証

そういうわけで、修了証の授与式もオンラインで行われた。沖縄総合事務局で内閣府の方から授与される代わりに、タイのバンコクから講師の宮崎先生よりオンラインで表彰してもらい、バーチャル修了証を受け取った。

オンライン修了式では他にも、スコア順位の上位3名による、作成した予測モデルについて試したことなどを発表する時間が設けられたので、私も発表させていただいた。

オンライン発表

予測モデルについて

今回作成した予測モデルは、OTSレンタカーでカンガラーの谷、ハブ博物公園、玉泉洞周辺に訪問する車両数を日別に予測するという内容。モデリングの手順は、①説明変数を決める→②データ前処理をする→③モデルを作成する→④予測結果をSIGNATEへ投稿するという流れで行った。

①の工程で選んだ説明変数の「誰と行くか」は、予測の対象となる目的変数の「車両数」と最も相関関係が高かった。選んだ理由は、観光アンケートの調査結果より「誰と行くかによって、訪問先や旅行先ニーズが明確になっている」という情報を得ていたからで、リアルな現地の情報が、予測の精度を上げるのにとても重要だということを実感した。

1日10回の制限!スコアが上がるまで③と④を繰り返す

モデルの精度が上がるまで、モデルの学習率を調整するなど見直しと予測を繰り返し行う。予測モデルの作成は、GoogleのColaboratoryで行っている。colabは、GPU環境を無料で利用できるので、予測モデルがデータを学習する時間が短縮され、モデルの見直しと予測の工程を繰り返す頻度を上げることができ重宝している。

Image Description

この記事を書いたひと:kaoru

ぬるま湯に浸かる人生を嫌い日々黒い画面に向き合う。
ルーティンワークに弱いが、クライアントの悩みを解決するテクノロジーには真っ向立ち向かう。
日が出ている時間に飲むことに憧れる。

All author posts

Note|おすすめ記事

2017.09.05

Docker ComposeでWordPress環境を作る

  Dockerについて WEB環境をつくる・消す・移動するを簡単に行うことができる。仮想サーバのようで、仮想サーバではなく、仮想サーバ上のOSが必要とするメモリやディスクリソースを必要としないため、軽量。手順をコード化 […]