sound

音の異常検知システム（音のAI・深層学習）

音のAI・深層学習

弊社では音に関するAIとして、以下のような技術を開発しております。

こちらもご参照ください。

異音判定

人間の耳でも行っている音の判別を、AIによって効率化・高精度化することが可能です。

以下、弊社で判定した音のデータを添付いたします。

【人の声・それ以外判定】

・OK音

・NG音

【プラスチック音判定】

・OK音

・NG音

【モーター音判定】

・OK音

・NG音

下になればなるほど、人が聞いても微妙な違いになっています。これらの技術は製造業において製品や部品、機械の異常を音から判断する際などに活用することができます。

音源分離・雑音抑制

弊社では、雑音環境下での入力された音よりノイズ除去処理を加えるAIを開発しております。活用場面としては、都会の雑踏からの必要な音の抽出・工場の中の様々な音から必要な音を取り出す等が挙げられます。

【複数名の声・雑音から対象の声を抽出】

例）複数の声から対象の声を抽出

・複数の人が同時に話している

・上の音声から１人の声のみ抽出

・抽出された残りの音声

例えば、会議の議事録を音声認識技術によって自動で作成する際に、複数の人が同時に話している状況だと上手く作成することができません。このとき、対象の音声を抽出することにより、このような状況でも誰が何を話したかがわかり、議事録を残すことができます。

【雑音環境から人の声のみ分離】

例）元の曲から伴奏と歌声を分離

・元の曲（22秒辺りから歌声が始まります）

・伴奏

・歌声

【様々な背景の音から異音を抽出】

例)大手自動車メーカの工場で稼働。抽出判定精度は99%を記録。

・In

・Out

工場などの雑音が多いところでも対象音のみ抽出することで、上で述べた異音判定をより高い精度で行うことができます。

音の生成

AIに様々な音のパターンを学習させると、音を自ら生成できるようになります。

正しい音声に異常な波形を付加して、別のAIの学習に利用できる異常音を生成したり、逆に劣化したマイクから入力された音声のノイズを補正してクリアな音に変えたりすることができるようになります。

【マイク入力音ノイズ補正サンプル】

抑制前(Noisy)

抑制後(Clear)

音声合成

音声合成とは、あるテキストに対して対応する音声を生成する技術のことです。弊社では、その活用事例の１つとして「声質変換」を行っています。以下、弊社で開発したAIによる音声合成と声質変換を行なった結果を添付いたします。

【通常の音声合成】

【声質変換サンプル】

これらの音声はいずれも女性の声ですが、明らかに違う声になっています。また、どちらも「機械っぽさ」が薄く、私たちが日常的に話しているときの音声に近いことがわかります。このような音声合成の技術は、弊社が開発した対話型AI HAL3, Deep AI Copyでも使用されています。

マルチモーダル感情認識

マルチモーダル感情認識とは、音声(=話している調子)と言語(=話している内容)の両方から感情を認識することです。私たちは普段、話している内容だけでなく、話している調子からも、相手の感情を判断しています。同じように弊社のAIでは、入力した音声から音声の特徴抽出と言語の特徴抽出の両方を行い、感情を認識します。

【感情認識サンプル】

話した言葉	A社のWeb版感情認識	弊社の感情認識
よろしくお願いします

悲しみ(疲れている)喜びいらっしゃいませ

悲しみ(疲れている)喜びお世話になっております。

悲しみ(疲れている)平静今晩いかがですか

悲しみ(疲れている)平静今晩いかがですか(元気なく)

悲しみ(疲れている)悲しみ

弊社の対話型AI HAL3にも感情認識機能が搭載されており、高い精度での感情認識を行うことができます。

Contact

お問い合わせ

貴社の事業内容にあわせてカスタマイズ可能です。
まずはお気軽にお問い合わせください。

お問い合わせ

Study about AI

AIについて学ぶ

対話AI完全ガイド｜医療・接客・教育まで網羅的に解説【2026】

対話AIとは、人と自然言語で双方向にやり取りするAIシステムの総称で、2026年現在は音声認識・大規模言語モデル（LLM）・音声合成・映像理解を統合した「マルチ...
AI読み上げ無料ツール7選｜自然な声の選び方と活用術【2026】

AI読み上げ無料ツールを選ぶときは「自然さ」「商用利用可否」「日本語品質」「API有無」の4軸で評価するのが、用途を問わず外さない選定基準です。本記事では、現役...
英語読み上げ無料サイト6選｜発音学習に使える厳選ツール

英語の読み上げ無料サイトを選ぶときは「アクセント切替」「速度調整」「単語ハイライト」の3機能を備えたものを優先するのが、発音学習に最も効きます。本記事では、現役...

音の異常検知システム（音のAI・深層学習）

音のAI・深層学習

異音判定

音源分離・雑音抑制

音の生成

音声合成

マルチモーダル感情認識

お問い合わせ

AIについて学ぶ

AIで、業務の生産性を変革しませんか？