はじめに

「対話システム」について耳目に触れる機会が増えました.対話システムとは,端的に言えば機械と人間がコミュニケーションするシステムのことです.対話システムには様々な類型があり,テキストベースで人間とやり取りすることで問題解決を行うチャットボットや,音声認識システムを備え人間との会話を通して操作や処理を実施するスマートスピーカーなどが挙げられます.
近年では,自然言語処理技術や音声認識精度の向上により,対話システムは実用的なものとして利用されています.本稿では,対話システムの歴史を紐解きつつ,主な研究事例や実用化事例を紹介します.

対話システム研究の歴史

対話システム研究の歴史は古く,1966年にはMITのJoseph Weizenbaum教授により対話システムの源流と言えるELIZAが開発されました.以降,段階的に性能は向上し1990年代には本格的な対話システムが実現します.そして今ではSiriやAlexa,Google Assistantなどのリアルタイム音声対話システムが私たちの身近なものとして存在しています.
しかしながら,これらの技術は一足飛びに実現したものではなく,古くから連綿と続く人工知能分野の研究によって結実したものといえるでしょう.

対話システムの主な研究事例

ここでは,対話システムに関連する代表的な研究事例を紹介します.

【1960年代】ELIZAの登場

上述した通り,ELIZAは原始的な人工知能であり,対話システムの源流として知られています.ELIZAはユーザーが入力した言葉に対し,あらかじめプログラムされた回答候補とペアリングすることで応答を返すという仕組みを備えていました.
ELIZAの実体は単純なパターンマッチと簡単な語句の置き換えによるものでしたが,その内容が臨床心理学者によるカウンセラーの会話内容を模倣していたものであったこともあり,まるで本物の人間と対話しているように感じられました.

出典:https://ja.wikipedia.org/wiki/ELIZA(2022年11月24日アクセス)
図1 EmacsでのELIZAの例(Wikipedia掲載画像)

【1990年代】TRAINS・VOYAGERなどの発展

単純なパターンマッチングではなく概念理解を実現することで対話システムを実装しようという研究も進みました.この考え方は,1990年代に登場した列車の運行計画を立てる対話システム「TRAINS」など,より実用性の高い対話システムへと発展しています.
また,音声認識技術の向上とともに,入出力のインターフェースとして音声を利用するシステムも登場します.MITが開発したVOYAGERは,音声認識・言語理解技術により道案内を行う音声対話システムです.VOYAGERは確率的な構文解析手法による言語理解と発話生成,音声合成技術を備えており,技術構成要素は現代で利用されている対話システムと近しいと言えます.
日本でも1990年代前半に音声対話システムの研究が進みました.1995年には科学研究費助成事業の重点領域研究「音声対話」プロジェクトが開始.多数の大学・企業等の研究者が参画し,ほぼすべての主要研究機関で音声対話システムが構築されました.

対話システムの主な実用化事例

近年では,対話システムの実用化が進んでいます.以下では,実用化された代表的な対話システムの事例を紹介します.

【2000年代】Let's Go! 京都ナビなど

2000年代に入ると,実用的な対話システムが登場するようになります.カーネギーメロン大学で開発された「Let's Go!」システムは,ピッツバーグ市内のバスの時刻表案内を行うシステムです.同システムは人間のオペレーターがいない夜間を補うサービスとして運用されました.
日本でも様々な対話システムが登場します.京都大学が開発した「京都ナビ」は,京都の観光地に関する情報を集め,質問に対して情報検索を行うことで対話を実現しました.また,奈良先端科学技術大学院大学で開発された「たけまるくん」は,奈良県生駒市コミュニティセンターの受付案内をはじめとして,様々な施設・イベントにおける来訪者対応を対話システムにより実現しました.本システムは運用を通じて収集した発話データベースと利用者の観察に基づく改良により実現されたものであり,Webやスマートフォンでも動作することができました.

【2010年代】IBM Watson, Apple Siri

2010年代に質問応答システムとして一世を風靡したのがIBMのWatsonです.2011年に公開されたWatsonは,アメリカで人気のクイズ番組で人間と対戦して勝利したことにより有名となりました.
クイズに回答するためには,問題文の趣旨を理解したうえで,適切な回答を推定し,さらに相手より速い応答速度で回答する必要があります.これを実現するために,WatsonはDeepQAフレームワークと呼ばれる,質問文を元に統計情報を参照して根拠の探索を行う仕組みを備えています.
また,2011年には当時最新であったiPhone4Sに登載されたことで話題となったのがSiriです.Siriは以下の機能を備えており,実用的な対話システムとして利用できました.

・音声認識により,ユーザーによる発話を聞き取ることができる.
・ユーザーからの質問に対し,インターネット上のWebサイトや各デバイスに保存されたローカル情報を基に,合成音声により回答できる.
・電話やメールなど,ユーザーによるリクエストをデバイス上のアプリケーションにて実行できる.

Siriは現在に至るまで性能が改善され続けており,ドライブ中や料理中などの手が離せない場面でも利用できるインターフェースとして利用されています.

人と機械の協調事例

近年,実用化されている対話システムでは,人と機械が協調してユーザーを支援するタスクを行う類型のものが増えています.ここでは,2つの事例を紹介します.

コールセンターにおけるチャットボットの活用

近年では,コールセンターにおいてチャットボットが導入される事例が増えています.この背景には,特に若年層を中心に電話への抵抗感が高まっており,テキストベースでの問い合わせが好まれていることがあげられるでしょう.
一方で,チャットボットは定型的な質問対応を得意とするため,必ずしもすべての質問に対応することはできません.そこで,定型的な対応はチャットボットで行いつつ,チャットボットが解決できない内容である場合には,コールセンターのオペレーターへ引継ぎを行うように設計されています.これにより,チャットボットと人間が役割分担をしながら,業務を効率化することができます.

東急㈱ リモート&AIコンシェルジュサービス

東急株式会社では,観光客からの質問に対応することができる「リモート&AIコンシェルジュサービス」を展開しています.同サービスでは,AIチャットボットによる問い合わせ対応,観光プランの提案,そしてスタッフによる遠隔での案内が可能です.
リモート&AIコンシェルジュサービスには,当社Nextremerの技術が採用されています.出口案内や乗換案内などのよくある質問はAIチャットボットが回答し,顧客のニーズや嗜好性に合わせた相談や観光の提案はスタッフが遠隔で実施することで,効率的な案内を実現しています.
本サービスは2021年3月から5月に実施した,渋谷駅での実証実験を皮切りに,2022年4月には長野県上田市,同年7月には静岡県の熱海・三島・伊豆高原の3エリアに端末を設置し,観光客向けの多言語観光案内システムとして活用されています.

図2 渋谷駅で設置された リモート& AIコンシェルジュサービスの筐体

おわりに

本稿では,対話システムの発展の歴史と主な実用化事例について紹介しました.
機械が人間の言葉を完全に理解しているというのはどういうことか,という点については哲学的な議論が必要です.ただし,現在の技術においては,チャットボットなどは言語表現を意味空間に結合できているわけではありません.つまり,人間と同様の方法で意味を理解しているとは言えず,機械はあくまで機械学習をはじめとした特定の手法により人間と同様の能力を発揮しているのが現状です.
一方で,人と機械が協調してユーザーを支援するタイプの対話システムの実用化については,コロナ禍を契機に広がりを見せています.対話システムの発展は,インフラ整備や社会情勢の変化といった環境的な要因と併せて,【人と機械の協調】のような社会実装のための突破口を見つけることに,鍵があるのかもしれません.

参考文献

河原達也:音声対話システムの進化と淘汰 −歴史と最近の技術動向−(人工知能学会誌, Vol.28, No.1, pp.45-51, 2013.)
10年間の長期運用を支えた音声情報案内システム「たけまるくん」の技術(人工知能学会誌, Vol.28, No.1, pp.52-59, 2013.)
Watson:クイズ番組に挑戦する質問応答システム(情報処理学会 2011.6)

著者紹介

向井 永浩
株式会社Nextremer 代表取締役社長CEO
金沢大学を卒業後,大手メーカーのシステムエンジニアとしてキャリアをスタート.その後外資系ITベンチャーでのキャリアを経て,2012年10月に株式会社Nextremerを設立.「データによって新たな価値を創出し,人の可能性を高め続ける」をミッションにAIソリューション事業を展開している.

おすすめの記事