AIによる画像分類について説明します!

 皆さん、「AI」や「ディープラーニング」という単語を耳にすることが最近増えてきたのではないかと思います。しかし、その仕組みについて知りたいと感じても、「私には難しそう...」と敬遠してしまっている方も多いのではないでしょうか?
 本記事では、AIによる画像分類について説明していきたいと思います!

概要

 
 画像分類では、AIが入力となる画像から最も似ていると考えられる対象を判別できるように、畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)と呼ばれる手法を用いて学習させます。画像分類AIでは入力画像から、その画像が最も類似している対象を検出します。
 ここで重要なのが、画像分類では入力画像にある対象の場所に関係なく、ひとつの画像からひとつの結果しか出力しないということです。カメラなどに搭載されている顔認識機能は複数の顔をボックスで囲っているので、画像分類と似た技術ですが異なる技術となります。

 例えば、左の画像を車、右の画像を街と判定することができます。

画像分類を行うAIの背景

 AIを構成する重要な要素として、ニューラルネットワーク(Neural Network, NN)と呼ばれるものがあります。この「ニューラルネットワーク」は人間の脳における情報交流の流れを模倣したもので、AIはこのニューラルネットワークで入力情報を「形」や「模様」、「色」など注目すべき特徴量と呼ばれる情報に分解し、入力情報から対象を判定できるように対応付けを行います。
 例として入力画像が「リンゴ」であるか判定する画像認識AIがあったとき、そのAIは映っている対象を「赤(色)」、「球状(形)」といった複数の情報に分割して、作成した「リンゴ」モデルの情報と結びつけて比較を行うことで判別を行います。

 画像分類では、AIが入力となる画像から最も似ていると考えられる対象を判別できるように、このニューラルネットワークを発展させた畳み込みニューラルネットワーク(Convolutional Neural Network, CNN)と呼ばれる手法を用いて学習させます。

  このCNNは、フィルタと呼ばれる領域を入力画像に合わせることでフィルタと画像の重なった部分の特徴量が計算されて形成される畳み込み層と、畳み込み層として抽出された特徴量を圧縮するプーリング層の2層が学習に大きな影響を及ぼしています。
 この畳み込み層とプーリング層の処理により、従来の点で特徴抽出を行い学習を行っていたニューラルネットワークに対して、領域で特徴抽出を行うようになったCNNで学習させたモデルの検出性能は大幅に向上し、画像認識の分野で広く使われるようになりました。

 また、当初、CNNは画像認識のために開発されたネットワークだったのですが、現在はその性能の高さから画像認識の他にも物体の認識やシーンの推定、音声認識など様々な問題・分野へと広く応用されています。

弊社での取り組み


 弊社では、ソファーなど形の決まっていないものの画像分類(正常・異常)などの判定を得意としており、精度も99%程出すことが可能となっています。