30代のほったらかし資産形成ー穏やかな未来への計画ー

運用スタイルは中・長期です。東京近郊でお得に楽しむ株主優待体験やイベント、決算内容を紹介します。

【データ分析|AIの前処理】Box-Cox変換によるAIの精度改善を実証

はじめに

前回はAIモデルを構築する際、データの前処理の方法としてBox-Cox変換によるスケーリング手法を解説しました。

今回は、Box-Cox変換を用いてAIの精度向上が実現できた結果について報告いたします。

Box-Cox変換

Box-Cox変換は、データの分布を正規分布に近づけるための変換処理です。

この手法についての詳細は、以下の記事で解説しています。

AIによるダム流入量予測

Box-Cox変換を使ってAI学習を行いました。

使用データ

使用データは宮城県に位置する釜房ダム流入量(m3/日)と蔵王地点の日降水量(mm)です。

釜房ダム国土交通省が管理しているダム諸量データベースからダウンロードしています。また、日降水量は気象庁の気象データベースからダウンロードしています。

国土交通省 ダム諸量データベース:https://mudam.nilim.go.jp/home

気象庁 過去の気象データ検索:https://www.data.jma.go.jp/stats/etrn/index.php

データ期間

学習期間は2015年1月1日~2020年12月30日、

検証期間は2021年4月1日~2021年12月30日です。

標準化とBox-Cox変換でのデータ精度比較検証結果

ダム流入量と日降水量に対して通常の標準化を行った場合と、日降水量にBox-Cox変換を適用して学習を行った場合の結果を比較しました。

AIモデルとしてはRNNモデルを使用し、精度評価にはRMSE(Root Mean Square Error)を使用しました。

グラフの黒の実線が実測流入量、青の実線が標準化のみの予測結果、赤の実線がBox-Cox変換を行った予測結果です。標準化による予測結果はRMSEが6.9、Box-Cox変換による予測結果はRMSEは4.0という結果になりました。

  RMSE
標準化による予測 6.9
Box-Cox変換による予測 4.0

流入量予測結果

流入量予測結果

いかがでしょうか。Box-Cox変換を適用した場合、RMSEが小さくなり、予測の精度が向上することが示されました。

データセットが比較的小さく、ハイパーパラメータの調整も行っていない点を考慮しても、Box-Cox変換が精度向上に寄与する可能性が示唆されています。

まとめ

今回はBox-Cox変換を使ったAI予測の結果を整理しました。Box-Cox変換はAIの精度改善にも役立つ可能性が示唆されました。

あなたはAIの学習にどのような工夫をしていますか?コメントで教えてください!