blog
AIブログ
第10回「豊かな感情を生成・合成する音声AIの世界」
[Siriは軍事研究から生まれた]
「AIは全知全能のゼウスでもなければ、魔法の杖でも無い。」これは何度かお話をしていますが、実際の所、全ての願いを叶えてくれる汎用AI(=強いAI)は、まだ先の未来の展望に過ぎないのです。ですが、何か希望めいたものを、誰しもがAIの未来に感じているはずです。AndroidやiPhoneに搭載されている音声アシスタントなどに「30分後にアラーム掛けて」と指示いて、あるいはAmazon EchoやGoogle Homeなどに「今日のニュースは?」と聞いて、相手からの不自然とは言い切れない和やかなAI音声が返って来た時、私たちは紛れもなく、そこに高度で複雑な技術性の実現を感じ取るのです。
音声生成・合成のAIをいち早く世界に知らしめた、もっとも影響力のある企業のひとつは、パーソナル・アシスタント・ソフトを開発したSiri社(旧ステレス・カンパニー社)となるでしょう。文字通り、私たちの知るiPhone搭載のSiriを開発した企業です。起業前の公式ウェブサイトには、次のような文言が記されていたようです。「私たちはシリコンバレーの次なる大企業を創ろうとしている。私たちの目標は、コンシューマ・インターネットの顔を作り替えること。私たちのポリシーはステルスでいること、次の巨大な仕事の仕上げを秘密に行うためだ。皆さんが考えるよりも早く、大々的にストーリーを明らかにしよう。」
彼らはDARPA(国防高等研究計画局:軍隊使用技術開発および研究を行うアメリカ国防総省管轄の機関)から支援を受ける事となり、軍研究としての「学習して体系づける認知アシスタント」のAI研究に没頭しました。プロジェクト名は「CALO」。ラテン語で「兵士の召使」を意味する「Calonis」に由来する名称だと言います。彼らの仕事は、想定していたよりも遅々とした小規模な仕上げになってしまったようですが、「Do Enginge」と呼ばれる高機能AIを確立しました。このエンジンは、計算を行う事、簡単な会話を行う事、航空機のフライト情報を調べる事、メモを取る事といった、「Do」をサポートすることが出来たのです。
彼らは更なる開発の為に、投資資金2500万ドルを必要としました。そこで、このDo Engineの一部を切り離した「Siri」を、2008年、アップル社に買収して貰う事となりました。当時、アップル社はこの「Siri」を、およそ2億ドルで買収しています。その後、アップル社はより「人間的な対話を促すAI」を実現するべく、音声生成・合成の技術性を高めます。そして、2011年、遂に私たちは「iPhone 4S」を通じて、そのSiriの自然な語り口調や数々の利便性に度肝を抜かされたのです。
[豊かな感情を生成・合成する音声AI]
前回、私たちクリスタルメソッド株式会社が主力開発を行っている「HAL3(ハルさん)」に、「豊かな感情を解析する音感情認識機能」というAIが搭載されている事を既に述べたかと思います。こちらの機能は、ユーザーの皆さんの声のトーンや言葉の特徴を適切に解析し、皆様の感情(喜怒哀楽)を分類・表示するものとなっています。同じ「アホ」という発言でも、喜怒哀楽によって、その言葉の真意が異なります。このAIは、そうした真意を読み取る潜在力があるのです。
また、こちらの音感情認識機能は、そのまま音声として生成・合成する際にも応用できるものです。例えば、AIが人間相手に「ちょっと待って」と伝える場合でも、状況や人間関係によって、その音声を大きく変化させねばなりません。警備巡回をするAIが不審人物を呼び止める場合は「ちょっと待って!(怒)」、相手から何か喜ばしい成果を報告された場合は「ちょっと待って、(喜)」、激しいクレームを受けて相手の話を理解できない場合は「ちょっと待って…(哀)」、自分が別処理をしている際に相手に配慮する場合は「ちょっと待って(楽)」、こういった具合です。
人間がそうした自然に行える対話性を、AIとして再現する。このような応用が、ビジネス・医療・行政などの幅広い業界から求められています。AIが感情的に話す事に違和感を覚える方もいらっしゃるかもしれませんが、私たちが感情的な生き物である以上、感情的な音声の出力は、今後の未来社会において必要不可欠な要素になるものと、弊社は考えています。
弊社の音感情認識AIの研究についてはこちらからご覧ください。
お問い合わせはこちらからよろしくお願い致します。
ご愛読いただきありがとうございました!
よろしければ弊社SNSもご覧ください!
Twitter https://twitter.com/CrystalmethodZ9
Facebook https://www.facebook.com/クリスタルメソッド株式会社-100971778872865/
Study about AI
AIについて学ぶ
-
「Diffusion Transformers (DiTs)」とは。わかりやすく解説
「Diffusion Transformers (DiTs)」とは Diffusion Transformers (DiTs) は、画像生成における新しいアプロ...
-
3D画像での異常検知システム(3DのAI・深層学習)
3DのAI・深層学習 3Dデータとは? 写真等の一般的な2Dデータは、ピクセル(画素)の縦×横の2次元の配列です。では3Dデータはどの様に表現されるのでしょうか...
-
AI問題点を分かりやすく解説!新たな技術の課題とは?
AI(人工知能)は革新的な技術である一方で、さまざまな問題点も浮かび上がってきました。本記事では、AIの問題点についてわかりやすく解説します。 AIの急速な発展...