弊社の機能について
雑音抑制
雑音抑制とは、AIが人の言葉と周りの雑音とを判別する機能です。
この技術は、耳が遠い方に必要な音のみを拾い上げ伝える補聴器に使用されています。
旧式の補聴器は、とにかく音を拾い集めて鼓膜に届けるものでしたが、雑音や騒音も拾ってしまうために、却って耳が痛くなってしまったり、肝心の声が聞こえにくいといった欠点がありました。
より快適な補聴器の研究を進めた結果、音響分析を用いて人の声や騒音・雑音の周波数を強化学習で覚えさせていきます。
必要な声の音声はそのままに、不要な音だけを抑えることでスムーズに聞き取りができるようになりました。また、強化学習で日本語に特化することで方言や訛りにも対応でき、ご年配の方でも聞き取りやすくしています。
雑音抑制はイヤホンにも使用されています。音声対話機能でハンズフリーに対応できるように、イヤホンも様々なメーカーが注目しています。若者のおしゃれアイテムになっているイヤホンやヘッドフォンに導入して、通話中の音声を聞き取りやすくしたり、ストレス軽減にも一役買っています。音への品質をこだわる企業も増え、いい音を聞きたいという購入者とのニーズが一致した例と言えます。
近年はオフィスの場でも見られるようになってきました。集中するためにイヤホンをして、余計な情報を入らないようにしている方や、オンライン会議の場などではマイク側に雑音抑制をすることで、余計なノイズを除去し、快適にやり取りすることができます。ボタン1つで瞬時に防音と集音機能を切り替える機能がついていたりと、小型ながら高性能なものが増えており、作業効率の向上につながることでしょう。
話者推定
音声認識の仕組みの項目で、音響分析により一度人の声を音素に分解するというお話をしました。その際に声の周波数や音の強弱を細かく解析しています。
このことを利用して開発されたのが話者推定です。
当然、人の声には個人差があり、それぞれ周波数や声のトーンが違います。男性であれば声は低く、女性であれば声は高いのは一般的ですが、そこからさらに細かく解析することで男性同士の会話の中でも細かな違いを見つけることで、違う男性が会話しているということを認識できるのです。
従来の音声認識では、大人数の会話では会話内容を音声データとして認識することは可能でしたが、誰がどの発言をしたかはわからず、議事録としては不十分だったのです。
人の声は一人一人違い、声紋と呼ばれています。大人数が会話する音声データの中でも違いを解析することで、今は誰が話しているのかを見極め、時間軸も記録することで、「○時○分に今○○さんが発言している」といった詳細なデータが取れるようになりました。
また、声紋は声認証のような生体認証システムにも使われています。
一度自身の声を記録させれば、同じ言葉・同じフレーズでも反応しないといった使い方も可能になっており、様々な分野への応用が期待されています。