Research
完全自動対話研究センター
研究テーマ
人間らしく自然で高度なテキスト・音声対話の実現
チームのミッション
完全自動対話センターは、まるで人間と会話するような自然なユーザー体験ができる高品質なテキスト・音声コミュニケーションサービスの実現、そのための技術開発に取り組んでいます。飛躍的な大規模言語モデルの進化により、対話理解、対話制御、応答生成の諸問題が大きく解決されました。それにより、人間が行う自然な対話には、テキストだけではない音声・身体モダリティの制御、応答時間の制御、長期間の記憶とその更新、さらには対話相手の心理作用への適応まで、多くの取り組むべき課題が残っていることが浮き彫りになりました。本研究センターでは、AI Lab の各研究チームの合同組織として、音声認識・音声合成、対話システム、大規模言語モデル、ヒューマンコンピュータインタラクションなど複数の領域にまたがる研究に取り組み、高品質な対話AIの実現に挑戦しています。
プロジェクト
① ターゲットタスクの達成率を高める接客対話AIの構築
近年、商業施設、宿泊施設、飲食店を始めとする接客業務において、アバターやロボットを用いた新たな接客手法が拡大しています。対話システムにより接客業務を自動化することができれば、企業は24時間365日の対応が可能になるとともに、これまで営業が入り込みにくかった領域や時間帯にも対応が可能となります。しかし、接客業務においては、商品を購入する意欲が低い、対話を続ける意欲が低いといった、ユーザが対話システムに対して協力的でない状況も想定されます。
そこで私たちは、ユーザの意欲を高めながら目標達成を目指すプロアクティブな対話システムの研究を進めています。本プロジェクトは、東北大学の赤間怜奈助教との共同研究を中心に、商品購入を目的としたセールス対話を対象に、セールス対話コーパスの構築、ユーザの購買意欲を高める対話要因の分析、セールス対話システムの開発を進めています。
② プログラマブルな身体付き対話システム構築と事業応用
対話システムには応答速度・低コスト・高いカスタマイズ性等、様々な需要が存在します。 ChatGPT等の外部サービスは強力ですが、個々のユースケースで異なる需要に対応したり、API仕様変更の影響を受けないようにしたりなど、外部サービスに頼らないシステムが必要となる場面があります。そのような場面に対応するために我々は、開発時点では最先端レベルとなる、各モジュールがプログラマブルなアバターとの音声対話ができる対話システムを開発しました。本システムの開発を経て得た課題感を今後の研究や、対話システムのさらなる改善に活かす予定です。また、研究開発を進めるとともに言語や音声等の幅広い分野を縦断し、対話システムの実社会応用に向けても動き出しています。具体的には開発で得た知見を他部署の対話システム開発に活かすことや、他部署と連携した研究を進めています。
研究領域
対話システム / 自然言語処理 / 音声認識 / 音声合成 / HCI