自然な音声対話が可能な「接客型デジタルサイネージ」を開発

2015 年 1 月 21 日
日本電信電話株式会社
ピーディーシー株式会社
自然な音声対話が可能な「接客型デジタルサイネージ」を開発
~能動的かつインタラクティブな情報提供を実現~
日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:鵜浦博夫、以下 NTT)とピーディーシー株式会社(本
社:東京都港区、代表取締役社長:菅原 淳之、以下 PDC)は、自然な音声対話が可能な「接客型デジタルサイネージ」を開
発しました。
今回開発した「接客型デジタルサイネージ」は、ユーザが情報検索をするとき、従来のようにタッチパネルを何度もタッチ
する必要がなく、ユーザの発話から単語の組み合わせなど分析し、ユーザの要望する情報を検索・提示するシステムです。
また、100dB の騒音下でも対話が可能です。
今回、NTT と PDC では、開発した「接客型デジタルサイネージ」のコンセプトの展示およびデモンストレーションを、2015
年 1 月 21 日(水)~1 月 23 日(金)にパシフィコ横浜で開催される日本ショッピングセンター全国大会「SC ビジネスフェア
2015」(http://www.jcsc.or.jp/event/bf2015/index.html)にて実施いたします。
今後、NTT と PDC では、NTT の研究所が持つ自然な音声対話を可能とする技術、および、あらゆる騒音環境下で目的
の音声をクリアに集音できるインテリジェントマイク技術と、デジタルサイネージ分野において国内で高いシェアを持つ
PDC のノウハウを活かし、能動的かつインタラクティブな情報提供を可能とする「接客型デジタルサイネージ」の実現を目
指してまいります。
■今後の展開について
商業施設や公共交通機関などのデジタルサイネージ導入事業者さまに対して、上記の展示会などを通じて、コンセプト
やユーザインタフェースデザインのフィージビリティを調査し、状況に応じた対話技術のチューニングなどを行い、今後、
NTT グループ会社を通じて「接客型デジタルサイネージ」のビジネス化を推進してまいります。
また、今後、訪日外国人などへの対応を図るため、接客型デジタルサイネージの多言語対応を行なう予定です。
1.背景
従来のデジタルサイネージシステムでは、ユーザが情報を得るためのインタフェースとしては、「タッチパネル」操作が
主流ですが、大規模な商業施設や駅など広範囲に多数の店舗を抱える施設においては、提示する情報が多岐にわたるた
め、ユーザが求める情報にたどりつくには、何度もタッチパネルをタッチする操作が必要となり、大きな手間となっていま
す。
また、音声認識を用いて案内を行うシステムでは、一問一答方式であるため、込み入った内容の検索を行うことができ
ず、また、設置場所が高騒音な環境であるため誤認識や再発声が必要となるなど、使い勝手が良いものではありません
でした。
2.取り組みの狙い
NTT は、研究所が持つ世界トップレベルの音響処理・音声認識・言語処理・音声合成をはじめとしたメディア関連技術を
活用し、システムがあらゆる騒音環境下で音声を認識して自然な音声対話を行い、ユーザの様々なニーズに応える「音声
対話プラットフォーム技術」の研究開発に取り組んでいます。
また、PDC は、昨今、商業施設や公共交通機関などを中心に、国内で急速に普及が進んでいるデジタルサイネージ市
場において、大型施設でのシステム導入数のトップシェアを持っており、今後、東京オリンピック・パラリンピックが開催され
る 2020 年に向けて、さらなる普及・拡大と競争力の強化を狙って、より幅広いユーザが使いやすいユーザインタフェースを
持つデジタルサイネージシステムの実現を推進しています。
今回両社は、NTT が持つ研究開発成果と、PDC が持つデジタルサイネージシステムおよびデジタルサイネージに関す
るノウハウを組み合わせ、デジタルサイネージにおいて、「接客型」という新しい価値を提供することを目指します。
3.「接客型デジタルサイネージ」における技術のポイント
(1)ユーザの意図や状況をわきまえた受け答え
接客型デジタルサイネージは、ユーザに能動的に話しかけ、ユーザが通常に人と話すような言葉で発した要望を解釈し、
ユーザが置かれた状況に応じてインタラクティブな情報提示を行うことで、自然な対話を可能とします。
また、外部情報(API)と連携することにより、商業施設や駅などで、様々な情報の提示を可能とします。
(例:商業施設内のレストランの待ち時間情報の提示、目的地に最初に到達する電車の情報など)
① クイックレスポンスでダイレクトな情報提示
「トイレはどこですか」のような質問は、すぐに最寄りのトイレに行きたいというユーザの意図を理解し、
クイックレスポンスでダイレクトに情報を提示します。
② 対話聞き取りによる適切な情報提示
「レストランを探しています」のような質問は、システムから能動的に「レストランのジャンルを教えてください」
などと自然な言葉で発話しながら、ユーザとの対話聞き取りを通じて、要望する情報を検索、提示します。
③ 状況判断による情報の取捨選択
「閉館時間は何時ですか」のような質問は、ユーザが置かれた状況(来店した日時など)に応じて、
「本日は木曜日なので、19 時に閉店です」などと状況判断を行い、情報を提示します。
④ 旬の情報提示
お店が提供したい旬のおすすめ情報(例:今週限定の旬な素材を使ったランチメニューの情報)など、
今週だけ、この時間帯だけといった旬な情報を提示します。
(2)騒がしい環境下でもユーザの音声を認識
NTT が開発したあらゆる騒音環境下で目的の音声をクリアに集音可能とする「インテリジェントマイク技術」を組み合わ
せることで、ショッピングセンターのような騒がしい環境下でもユーザの音声を認識することが可能となります。一般的な駅
や商業施設の騒音レベルは60~80dBであり、NTTのインテリジェントマイク技術を用いると、これら騒音環境下でも、音声
認識が可能です。
(3)システム作成者におけるコスト削減メリット
詳細な粒度の固有表現を獲得する固有表現抽出技術※1、および、低コストで作成可能な学習データに基づくタスク判定
技術※2 の活用により、これまでと同じ対話のシナリオを作成する場合には、対話ルール数の削減(従来に比べて約 50%削
減)が実現できます。
<用語解説>
※1 固有表現抽出技術
人名、地名、組織名等(固有表現)を単語列から抽出し、そのカテゴリを推定する技術。対話ルールを単語でなく、
固有表現カテゴリで記述することでルールの抽象度を高めることができます。
※2 タスク判定技術
音声対話エージェントに対するユーザの発話内容から、ユーザがどのような情報を求めているのかを推定する技術。
<コンセプト・イメージ>
なにか
お困りですか?
システムから能動的に発話を
促すメッセージを発信
イントロダクション
ユーザ
発話
トイレは
どこですか
「トイレ」の場所を
表示します
ユーザのニーズがすぐに応答が必要
なものである場合,要求に応える情
報をダイレクトに提示する
クイックレスポンス
レストランを
探してるんだ
「レストラン」の
「ジャンル」を教えて
ください
「和食」がいいな
「和食レストラン」の
一覧を表示します
自然な言葉で対話をしながらユーザ
のニーズを絞り込み,適切な情報を
検索して提示する
対話聞き取り
閉館時間は
何時ですか?
本日は「木曜日」なので
19時閉館です
3時間後になります
曜日・時刻
情報
日時や天候など,ユーザが置かれた
状況に応じて情報を加工・取捨選択
して提示する
状況判断
<参考 1> ピーディーシー株式会社について
ピーディーシー株式会社は、2001 年10 月、パナソニック株式会社の社内ベンチャー制度第1 期で、「大型ディスプレイ向
け映像コンテンツ制作・配信・運営管理」の専門会社として誕生しました。現在、株式会社ドコモ・ベンチャーズが 19.2%の出
資をおこなっています。設立以来、業界最高レベルの顧客様のシステム構築とコンテンツ提供を行ない、また、映像システ
ムの構築から、 コンテンツ制作、配信管理、顧客情報分析までトータルソリューションを提供しています。
<参考 2>デジタルサイネージの現況
国内のデジタルサイネージ市場は、年々拡大の一途をたどっており、2012 年には約 822 億円、2020 年度には
2,520 億円市場へ成長すると見込まれている。当初、駅や車両の運行情報や金融機関の金利情報の表示に活用され
たが、全体の低コスト化につれて、幅広く需要層が広がり、表示内容も情報告知から販促/空間演出、広告など多様
な展開を見せている。(http://www.fcr.co.jp/pr/13037.htm)
【本件に関するお問い合わせ】
日本電信電話株式会社
サービスイノベーション総合研究所
企画部広報担当
TEL: 046-859-2032
E-mail: [email protected]
ピーディーシー株式会社
管理部広報担当
TEL: 03-5575-2455
E-mail: [email protected]