弊社製品「Deep Freq」とは音源分離技術を活かした音のAIです。
様々な場面で雑音除去を行ったうえで、特定の音を認識し他の音と差別化することができます。

目次
音源分離のしくみ
分離の種類
導入事例
今後の活用例

 


音源分離のしくみ

そもそも、音源分離とは音響メディアを対象とした信号処理技術の一つです。
具体的な処理内容としては、複数の音声が混じった環境下で特定の音声のみを抽出することができます。特定の対象音は、AIに学習させることで人の声、機械音、楽器音など、種類を問わず抽出可能となります。

ここでは音源分離のしくみをご紹介します。
音源分離の基本的な処理は、周波数-時間(縦軸-横軸)で表記されたスペクトログラムを波形の特徴ごとに分解することによって行われます。(図1)

図1

図1では、様々な音が混ざっている工場内の音声から、対象のコネクターをさす音のみを抽出しています。
このように、音源分離技術を用いて元の音声をコネクター音とそれ以外の環境音(雑音)に分けることができます。
抽出後の対象音はコネクターを指す音が正常な完成品の音であるかどうかを判定する材料になります。弊社では音源分離の他に、抽出した音を基にした音の異常判定も行っております。

音の異常判定については こちら

分離の種類

人の声の分離

雑音から人の声のみを抽出することができます。
さらに、複数の人の声を区別をすることも可能です。

具体的な使用例としては、会議の議事録作成などがあります。
各人の声が区別して認識されることで、発言者を明確にし議事録の作成を容易にすることができます。

・複数の人が同時に話している

・上の音声から1人の声のみ抽出

・抽出された残りの音声

工場での特定音の分離・異音検知

工場内の雑音からモーター音、機械音、スイッチ音、プラスチック音などを抽出し、それぞれの音の正常・異常判定をすることができます。
以下では音源分離によって抽出されたプラスチック音とモーター音の異音判定をご紹介します。実際に工場にて弊社の異音判定システムが導入されています。

特定音の抽出・異音判定:

【プラスチック音判定】
・OK音

・NG音

【モーター音判定】
・OK音

・NG音

楽器の分離

合奏の音声から各楽器パートの音を分離することができます。
学習の精度が上がることで、楽器の種類だけでなく、誰の演奏による楽器音かまで、特定可能となることが期待されています。

この技術により、各楽器の音源分離データが収集されることで、楽器ごとの楽譜を作成する自動採譜が可能となったり、一度しか録音することのできないライブ音源の音質改善やリミックスなどの編集が可能になることも考えられます。

歌の分離

伴奏付きの合唱音声から、歌声と伴奏の音を分離することができます。
この技術により、楽譜購入サイトや楽譜に付随したCDに伴奏音声と歌声の音声を分けて収録し、購入者が練習に役立てることも可能となります。

例)元の曲から伴奏と歌声を分離

・元の曲

・伴奏

・歌声

導入事例

<製造業での異音検知>
音源分離により抽出された特定音の異音判定システムを工場に導入しました。

例)大手自動車メーカの工場で稼働。抽出判定精度は99%を記録。

今後の活用例

ビデオ会議ツールでのリアルタイム雑音抑制>

コロナウイルス感染症の影響でリモートワークが推奨される中、
ビデオ会議を行う場面も格段に増加していることと思います。

そこで、いずれはビデオ会議の最中にリアルタイムで周囲の雑音を消し、自分の声のみを相手に聞こえる状態にすることが、弊社の雑音抑制・音源分離の技術により可能になると考えています。

これにより一人ひとりの声の録画データができることで、議事録の作成も容易になると推測されます。

お問い合わせ

弊社のDeepAICopy技術についての詳細をご希望の方、ご利用になられたい方は、こちらのフォームに必要事項をご記入の上お問い合わせください。

クリスタルメソッド 株式会社

〒102-0073
東京都千代田区九段北4丁目1-14 TLビル5F

都営新宿線「市ケ谷駅」より徒歩3分
東京メトロ有楽町線・南北線
JR 総武線「市ケ谷駅」より徒歩5分