blog
AIブログ
第8回「クリアーなスマホ通話音を実現するAIの世界」
ベイズのアプローチ
「AI自らが、学習の積み重ねによって、より高度な判断を行う」。これが、AI技術に用いられている「深層学習」の特徴です。
この深層学習によって、特化型AI(弱いAI)は様々な分野への応用がなされています。人間のような、あらゆる活動を行える汎用AI(強いAI)はまだ登場していませんが、そうした前人未到の領域に関する研究も大いに進められている昨今です。
さて、そうした特化型AIの優れた機能性を示すものとして、「フィルタリングや分類」というものがあります。こちらの分野では、AIは人間以上の働きぶりを示します。例えば、皆さんがお使いになっている「Eメール」というオンラインサービスには、「スパムメール(迷惑メール)」の機能が必ず搭載されています。このフィルタリング機能は、メールに含まれているテキストから、それが通常のメールか、迷惑メールかを判断するのです。「迷惑メールであるらしい」という可能性が一定率以上なら、AIは自動的に別フォルダへの分類、または削除を行います。
この「迷惑メール自動分類」には、「ベイズのアプローチ(ベイズの定理:18世紀のイギリス牧師・数学者トーマス・ベイズによって見いだされ、その後にフランスの数学者ピエール=シモン・ラプラスによって広められた数式)」と呼ばれる考え方がベースとなっています。この数式は、「事前にある判断を持っている状態で、新しい情報を獲得した際、その判断を修正する」というアプローチを、数字として証明したものとなります。例えば、「メールには『割引』というテキストが10回以上登場しているので迷惑メールである可能性が40%ほどある(事前の情報)が、個人名が繰り返し登場している(新しい情報)ので、迷惑メールである確率は20%程度になりそうだ(判断の修正)」という思考の流れが、このベイズのアプローチに相当します。
迷惑メールはまだシンプルなタイプの電子世界の話ですが、現実世界では更に複雑な因果関係が交じり合っていますから、そこでは「拡張したベイズの公式」が導入されています。「要因が複数ある場合の因果関係の分析」を行うに当たっては、「ベイジアンネットワーク」という計算が用いられます。このベイジアンネットワークは、状況変化に俊敏に対応する運営が可能となる為、音声認識、文字認識、データマイング等、幅広い応用対象があります。珍しい応用事例では、刑事捜査に用いられるプロファイリングやDNA鑑定も、徐々にこうしたベイジリアンネットワークの考え方が導入されたAI活用が始まっています。
クリアーなスマホ通話音を実現するAI
音声の世界では、「ノイズ」もまた、「迷惑メール」のように不必要なフィルタリング要素となります。例えば、私たちがスマートフォンで通話をする際、自分や相手の環境によっては雑踏・自動車・作業などの背景音により、相手の声がクリアーに聞こえないという事があると思います。介護、オフィス、製造、医療現場等、声が聞き取りにくい点は非常に大きなデメリットです。そこで、迷惑メールを自動分類するように、ノイズもまた「ノイズキャンセル」という方法で除去する、このような機能開発が進められています。AIはこの分野においても、特化的な機能性を発揮しているのです。
プロファイル搭載のプロセッサーを導入したイヤフォンや変換アダプターを介して、数千万種類に及ぶバックグラウンドノイズを瞬時にAIが異音判定し、それらを音源分離等によって低減させ、高調波状態(自分が聞きたい音のクリアーな状態)を保持する事が出来る、そのような製品が実用化され始めています。弊社クリスタルメソッド株式会社の開発を代表する「HAL3(ハルさん)」にも、このようなフィルタリング系のAI技術の導入を進めております。詳しくはこちらをご覧ください。
また弊社の音源分離等の技術についてはこちらからご覧ください。
お問い合わせはこちらからよろしくお願い致します。
ご愛読いただきありがとうございました!
よろしければ弊社SNSもご覧ください!
Twitter https://twitter.com/CrystalmethodZ9
Facebook https://www.facebook.com/クリスタルメソッド株式会社-100971778872865/
Study about AI
AIについて学ぶ
-
「Diffusion Transformers (DiTs)」とは?わかりやすく解説します!
「Diffusion Transformers (DiTs)」とは Diffusion Transformers (DiTs) は、画像生成における新しいアプロ...
-
3D画像での異常検知システム(3DのAI・深層学習)
3DのAI・深層学習 3Dデータとは? 写真等の一般的な2Dデータは、ピクセル(画素)の縦×横の2次元の配列です。では3Dデータはどの様に表現されるのでしょうか...
-
AI問題点を分かりやすく解説!新たな技術の課題とは?
AI(人工知能)は革新的な技術である一方で、さまざまな問題点も浮かび上がってきました。本記事では、AIの問題点についてわかりやすく解説します。 AIの急速な発展...