音の生成とは?その仕組みについて解説します

皆さん、「AI」という単語を耳にすることが最近増えてきたのではないかと思います。しかし、その仕組みについて知りたいと感じても、「私には難しそう...」と敬遠してしまっている方も多いのではないでしょうか?

ここでは、AIの利用手段としての音の生成について、仕組みを分かりやすく解説します!

AIに様々な音のパターンを学習させると、音を自ら生成できるようになります。

大まかな仕組み

データをCNNに入力し、「通常の音声」と「ノイズを付加した音声」との対応を学習させます。

こうすると、ノイズ混じりの音声に対して、ノイズを引いたクリアーな音声を生成したり、逆に、クリアーな音声を入力し、それに対して異常な波形を付加するようなAIを作ることが出来ます。

音の合成

ノイズ混じり音から、クリアーな音声を生成するというのは、劣化したマイクから入力された音声に対してフィルタリングを施し、高音質なものに変えたりと言ったことに利用できます。

以下は弊社のサンプルです。

上がノイズ抑制前、下がノイズ抑制後です。

逆に、ノイズを付加するAIについては利用方法が一見無いように思えますが、他のノイズを用いたAIに対する学習データとして活用したりできます。

以下は弊社のサンプルです。

上がノイズ付加前、下がノイズ付加後です。