第4回「AIがエンターエイメント分野に進出する日へ」

エンタメ 対話AI 動画作成 アイドルの代わり DeepAICopy

近年、スマートフォンのSiriやスマートスピーカーのAlexaなどに代表されるように、何かを問いかけると対話をするように物事に応えてくれる製品が身の回りに増えました。SFドラマの金字塔として知られる『スタートレック』で、船長や船員の言葉を何でも理解して宇宙航行の支援を行ってくれる「コンピュータ」という夢が、実現しつつあるのです。そのような夢の技術の中で、AIはとても重要な役割を果たしています。

これは革新的と言えるような出来事です。これまで、機械が人間とコミュニケーションによって対話する機能を持つ事は、とても難しい事だと言われていました。私たちが成長後に何気なく「対話」という行為は、想像を絶するような高度な情報処理が必要であるからです。

機械が人間と対話をする場合、まずは機械が人間の発する「音声」を理解しなければなりません。しかし、この音声という情報を入力するだけでは当然不十分です。機械はそれらの音が、何を意味するのかという点についても適切に分析を行わなければなりません。そして、そうして理解した意味に基づいて、自分が何を言い返すかを処理し、出力を行わねばなりません。こうしたプロセスはただでさえ複雑なものですが、人間の場合はこれを「瞬時」に行う必要があります。

AIの役割は、機械が空気の振動を数値化したデータを受領してから始まります。そのデータから意味を引き出すのが、AIの役割なのです。しかし、私たちが知っての通り、人間の言葉というのは機械のように統一的ではありません。私たちは対話の中で、外国語の学習本のように「私は今日の天気を知りたいです」とは問いかけません。「今日の天気は?」「これから雨降るの?」といった調子で問いかけるのが自然です。このように主語・述語・目的語の変形、前提条件となる場所・時間・季節等の省略、性別・年齢による言い回しの変化など、同じ意味であっても対話というのは多彩な変動を伴います。

こうした「曖昧さ」を理解する為に、AIの深層学習という仕組みが役立ちます。AIは膨大な文章の使用例を自律的に蓄積・分析・活用する事が出来る仕組みとなっており、この学習の繰り返しによって対話の精度が向上します。こうして、かつてはRPGゲームのNPCキャラクターのように「何を言われても同じ事しか答えられなかった」という機械が、AIの登場によって革新的な進化を遂げ、人間に一歩近づく事になったのです。

人間とコミュニケーションを取れる「対話AI」の登場は、私たちの文化世界に更なる衝撃を与える様々な潜在力を有しています。銀行・郵便局・駅といった公共施設から、スーパー・コンビニ・映画館といった商業施設、そして介護や医療の現場などに至るまで、対話AIが搭載された装置やロボットは人間のサポーターとして多くの機能を果たします。また、私たちは生活を超えたエンターテイメント分野においても、この対話AIの活躍を大いに期待出来ます。ディストピアな雰囲気もありますが、それも「コミュニケーションを取れる対話AI」がアイドルの代わりのように舞台に立つような光景も、ひとつの文化として成立し得る可能性が存分にあるのです。

対話AIを偶像的な存在としてエンタメ界に関わらせる試みは多数見受けられます。NHKの紅白歌合戦で企画された、AI技術を介した歌手・美空ひばりさんの自動生成映像によるショーなどは、そうした対話AI活用の顕著な一事例です。故人をAIによって再現する試みは倫理的・感覚的には賛否両論もあるでしょうが、とにかく、すでにこのような技術が現実のものとして登場しているという点に私たちは注目をしなければなりません。

YouTuberなどの動画制作のエンタメ分野においても、今後、対話AIの活用事例が登場するかもしれません。弊社が開発した「DeepAICopy」もこの分野への応用が利く革新的なプログラムです。「DeepAICopy」は現実にいる人間の情報を登録する事により、その人間の持つ容姿と個性を組み込みます。組み込んだ後の対話AIを用いれば、映像と共に対話を自動生成させる事が可能となります。まるで、「その人そっくり」に話し、動きます。この技術を用いれば、新しい動画制作の活路を見出せるかもしれません。

このように、対話AIの存在感がエンターテイメント世界で徐々に高まりつつあり、今後もますますその需要が高まる事と予想されます。対話の出来る機械は、これから私たちに新しく鮮やかな文化の形を示してくれる事でしょう。