30代のほったらかし資産形成ー穏やかな未来への計画ー

運用スタイルは中・長期です。東京近郊でお得に楽しむ株主優待体験やイベント、決算内容を紹介します。

【データ分析】AIの種類

はじめに

AIには様々な分析手法があります。そこで、自身の経験を活かしてAIの種類やその違い、AI活用時の注意点についてまとめてみました。

AIの種類

AIは以下のように分類ができます。

AIの種類

AIの種類

ルールベース型

事前に人間によって定義されたルールや規則を使用して問題を解決します。これらのルールは人間によって設計され、それに従って処理を行います。

 

教師あり学習機械学習

ラベル付きのトレーニングデータを使用して、モデルがデータのパターンを学習するアプローチです。特定の入力に対して正確な出力を予測することが目標で、分類や回帰などのタスクに使用されます。

人が対象をよく観察して特徴量(重要な情報)を設計する必要があります。

 

教師なし学習機械学習

ラベルのないデータから構造やパターンを抽出する手法です。クラスタリング、主成分分析などに使用されます。自動的に分類や次元の削減を行い特徴量を抽出できますが、特徴量の判断は人間が行う必要があります。

 

強化学習機械学習

エージェントと呼ばれる学習主体(AI)が環境内で行動し、その結果として報酬を受け取りながら、最適な行動戦略を学習する方法です。ゲームプレイ、ロボティクス、制御システムなどの領域で応用されています。

例えば、二足歩行ロボットが歩く速度や脚の曲げ方について試行錯誤を行い、長い距離を歩いた場合に報酬を与えるといったことを繰り返し、最終的には倒れずにスムーズな歩行ができることになります。

 

深層学習

多層のニューラルネットワークを使用してデータの高度な表現を学習する手法です。自動的に特徴量を抽出し、非線形関数の組み合わせよる強い表現力が強みです。

ルールベース型と強化学習の違い

正誤判断

ルールベースは、正解が事前に分かっている場合に適しています。一方、強化学習は正解が分かっていなくても、行動の良さを評価して学習することができます。

 

ルール設計

ルールベースは、複雑な問題に対してルールを設定するために膨大な数のルールが必要となることがあります。特に、問題の条件や状況が多岐にわたる場合にはルールの数が増えます。これはメンテナンスと管理が難しく、複雑な問題には適していません。

 

時間的制約

ルールベースは、膨大な行動をすべて探索する場合は、計算コストが高くなります。問題に対して計算上の時間的制約が存在する場合は、計算が間に合うのかを検討する必要があります。

量子コンピュータを活用すれば高速な計算ができる可能性がありますが、まだ実用化されていないことに注意が必要です。

一方で強化学習は、学習時は計算コストが高くなりますが、結果出力時の計算コストは高くありません。

 

環境変化

ルールベースは、環境の変化に対応するためにルールを継続的に調整および最適化する必要があります。新しいルールを追加し、古いルールを修正することが必要です。

一方、強化学習は報酬に応じて、環境の変化に柔軟に対応できます。強化学習は特に、未知の状況に対処するために有用であり、報酬に基づいた学習を通じて最適な戦略を見つけることができます。

 

ルールベース型と強化学習の違い

ルールベース型と強化学習の違い

AI(機械学習)活用時の注意点

AI活用時にどんなことに注意すればよいか自分が経験したことをお伝えします。

取得データ

ノイズが多い画像や音声データではなく、ノイズの少ない信号データは取得した方が適切な結果が出力されます。画像データは外部環境やカメラの内部パラメータによって取得データが一定になりません。外部環境や内部パラメータの変化が許容できるのか、分析手法は許容できるのか、分析したいことをもう一度考えてみましょう。特にこれから収集するデータはノイズが少ないデータを取得する方法の検討することが望ましいです。

 

分析手法

統計分析はシンプルが一番です。近年注目されている深層学習が本当に必要かもう一度考えてみましょう。案外従来の機械学習で十分分析が可能なことが多いです。従来の機械学習を利用するにしても分析の目的を振り返って手法の本質を確認しましょう。

 

データ品質

データの品質の確保は非常に重要です。取得したデータが信頼できない場合、誤った結果を出力する可能性があります。データが信頼でき、正確であることが重要です。取得したデータを何も考えずに学習させるのではなく、取得した生データを可視化して、自分の目で俯瞰して確認してみましょう。

 

データ量

データ量が不十分な場合、特定のパターンに過剰に適合(過適合)し、一般化が難しくなります。やりたいことによって学習データ量は異なりますので、先行文献を調べて必要なデータ量を確認しましょう。先行文献は先人達の知恵です。データの前処理を工夫していることもあるので、積極的に活用しましょう。

 

データ処理

時系列データの場合は欠損データを適切に処理する方法を検討する必要があります。線形補間するのか、欠損データ箇所を削除するのか、二値変換するのか、特徴量に応じて検討しましょう。

ノイズがある場合は適切にフィルタリングする必要があります。移動平均するのか、メディアンフィルター処理をするのか、特徴量に応じて検討しましょう。

 

まとめ

AIの種類や活用する時の注意点について整理しました。AIは深層学習だけではなく、かなり広義な意味合いとなりますので、AIの議論をするときにはAIのうち、どの種類のことかお互いに確認しましょう。この整理がAIに関する理解を深める手助けとなれば幸いです。