─ 機械学習のモデル構築プロセスと導入のポイント─ AIのビジネス活用を成功させるために 1/3

0414

近年、AI の基礎技術である機械学習をビジネスに活用してサービスの価値を向上させる動きが盛んだが、そのためには、機械学習のモデル(学習アルゴリズムを実装したプログラム)をどう構築するかがポイントとなる。本稿では、機械学習の応用である物体認識を例に、モデル構築のプロセスと留意点について解説する。


クラウド事業推進部 アプリケーションエンジニア 岩崎 聖夜

拡大するAIの導入

近年、米国のGAFA(Google 社、Apple 社、Facebook 社、Amazon.com 社)のような一部の巨大IT 企業に限らず、多くの企業においてAI が積極的に導入されるようになっている。総務省の「平成30 年版 情報通信白書」には、AI、IoT(AI を用いないデータ分析)およびIoT によるデータの取得・蓄積に関する導入状況と導入意向を調べた結果(日本、米国、英国、ドイツ)が載っている。

日本におけるプロダクト(製品・サービス)へのAI の導入状況および導入意向を見ると、「2018 年時点で導入済み」が20%、「2020 年ごろに導入予定」が40%、「2025年以降未定」が60%である。AI の導入は近い将来にも急速に進んでいくわけで、これに遅れると先行企業との競争力の差が広がっていくのではないかと思われる。なお、IoT の導入も含めて、現時点では日本は他の3 国と同じような数字だが、将来は差を付けられることが示されている。白書には「今後の導入予定の回答率を踏まえると、2020 年以降は他国より遅れをとり、その差が開いていくことが懸念される」と書かれている。

このように、将来の競争力を左右する重要な要素の1 つと目されるAI だが、実際に活用しようとすると、何から手を付ければいいか分からずに失敗するケースが少なくない。そこで以下では、AI の基礎技術である機械学習について、その応用分野である物体認識を例に、モデル構築の基本的なプロセスと、サービスの価値向上や業務効率化を目的に導入する際に最低限押さえておくべきポイントを解説する。

モデル構築の基本プロセス

物体認識は、コンピュータの入力として画像データが与えられた場合に、その画像に写っている物体の種類や名前を出力することである。機械学習を用いて物体認識を実現するためには、まず「何が写っているのか」を併せて記録した大量の画像データ(教師データ)を用意し、モデルに入力する。それにより、モデルは写っている物体の特徴を自律的に学習していき、最終的に、画像だけを入力しても、そこに写っている物体を識別できようになる。このモデルを構築する基本的なプロセスは以下の通りである。

①モデルの要件の定義
物体認識によって何を実現したいかを定義し、モデルに求められる能力を明確にする工程である。ここでは、モデルが学習するために必要な教師データはどのようなデータかも具体化しておく。

②データの収集
教師データをどこからどのように集め、どこへ格納するのかを決め、実際にデータを集める工程である。

③データの前処理
ファイル形式や画像サイズを統一するなど、不ぞろいなデータ属性を均一化し、質の良い画像データのみを選択し、写っている物体の種類や名前をラベルとして与え、画像データとラベルのセットとして教師データを作成する工程である。学習効率を高めるためには、ノイズ軽減などの補正が必要になる。また、異なる方向から見た画像も教師データとして集めれば、モデルの性能(認識精度)を高めることができる。

④モデルの開発と学習
モデルの要件や入力とする教師データの特性に基づいて学習アルゴリズムを開発し、モデルに学習させる工程である。初めは、教師データの一部を用いて簡易的な性能検証を行いながら開発し、最後には8 割程度の教師データを用いてモデルに学習させる。

⑤モデルの最終的な性能の検証
残りの2 割の教師データを使用して学習済みモデルの性能を検証する工程である。性能が目標に達しない場合は、②~④の工程を見直し、あらためて学習と性能の検証を行う。

⑥サーバーへのモデルの展開
目標の性能に達したモデルをサーバー上に展開し、クライアントアプリから利用できるようにする工程である。

お問い合わせ

当社のサービス・製品に関するご相談やご質問、お見積りのご依頼など、こちらからお問い合わせください。