音のAI・深層学習

こちらもご参照ください。

★目次★

異音判定 ・・・ 特定の音声を判定 (人の声・プラスチック音・金属音・コンクリート音)。

音源分離・雑音抑制 ・・・ 特定の音源から発生する音を抽出。混ざった人の声の分離・雑音と人の声分離。

音の生成 ・・・ 学習データにする異常音の生成。劣化したマイクの音の補正。

音声合成  ・・・ 滑らかにアクセントよく合成 声質変換対応。

マルチモーダル感情認識 ・・・ 音とそれに紐づくテキストから感情推定。

 


★異音判定

 

従来、長年業務に携わっている熟練者ではないと判断が難しかった音の判別が、AIによって効率化、高精度化しています。弊社で判定した音のデータを

添付いたします。

 

【人の声・それ以外判定】

・OK音

・NG音

【プラスチック音判定】

・OK音

・NG音

【モーター音判定】

・OK音

・NG音

 


★音源分離・雑音抑制

 

弊社では、雑音環境下での入力された音よりノイズ除去処理を加えるAIを開発しております。活用場面は都会の雑踏からの必要な音の抽出・工場の中の様々な音から必要な音を取り出すなどなどです。

 

【複数名の声・雑音から対象の声を抽出】

例)会議の議事録などで利用。

・混

・一人

・余り

 

【雑音環境から人の声のみ分離】

例)歌と人の声で分離をしている。伴奏と歌声を分離している。

・曲

・オケ

・歌

 

【様々な背景の音から異音を抽出】

例)大手自動車メーカの工場で稼働。抽出判定精度は99%を記録。

・In

・Out

 


★音の生成

 

AIに様々な音のパターンを学習させると、音を自ら生成できるようになります。

正しい音声に異常な波形を付加して、別のAIの学習に利用できる異常音を生成したり、逆に劣化したマイクから入力された音声のノイズを補正してクリアな音に変えたりすることができるようになります。

 

【マイク入力音ノイズ補正サンプル】

抑制前(Noisy)

抑制後(Clear)

 


★音声合成

 

TTSという、テキストから発話を行う事が出来るソフトウエアがあります。日本語でも各社からエンジンが登場しており、群雄割拠の状況です。

 

【通常の音声合成】

【声質変換サンプル】

 


★マルチモーダル感情認識

 

入力した音声から音声の特徴抽出と言語の特徴抽出を行い、AIが感情を認識します。

【感情認識サンプル】

話した言葉A社のWeb版感情認識弊社の感情認識
よろしくお願いします

 

悲しみ(疲れている)喜び
いらっしゃいませ

 

悲しみ(疲れている)喜び
お世話になっております。

 

悲しみ(疲れている)平静
今晩いかがですか

 

悲しみ(疲れている)平静
今晩いかがですか(元気なく)

 

悲しみ(疲れている)悲しみ

クリスタルメソッド 株式会社

〒102-0073
東京都千代田区九段北4丁目1-14 TLビル5F

都営新宿線「市ケ谷駅」より徒歩3分
東京メトロ有楽町線・南北線
JR 総武線「市ケ谷駅」より徒歩5分