テキストマイニング技術を利用した お客様コールログ分析

テキストマイニング技術を利用した
お客様コールログ分析
北村 美穂子 村田 稔樹
佐々木 美樹 奥村 晃弘
近年、データの利活用技術が急速に進み、計算処理が容
語に分割し、単語間の係り受け関係を同定したり、意味的
だ文章や音声データもデータ分析に利用する試みが活発
マイニングと呼ばれる「統計処理技術」の 2 つの技術で構
易な数値や構造化データだけでなく、曖昧性を多く含ん
になっている。
特に、お客様からのクレームや要望等が集まるコール
センターのお客様の問合せ内容記録(以降、「インバウン
ドのコールログ」と呼ぶ)の分析は、サービス向上や新製
品の開発に直接活かすことができるため顧客志向の経営
では欠かせない技術である。その一方で、分析の方法論は
確立されておらず、試行錯誤的な要素が多い。
我々は、インバウンドのコールログの一般的な特徴を
調査し、かつ、その分析結果を利用する現場の要望をヒア
リングした。その結果から、インバウンドのコールログを
分析するための 4 つの分析観点を策定した。さらに、4
つの分析観点毎にコールログを自動分類し、観点別の時
系列変化や観点間の関係を見える化することで効果的な
分析を行っている。
本稿では、まず、基本的なテキストマイニング技術につ
いて説明し、次に、我々が策定したインバウンドのコール
ログの分析観点について説明する。次に、本手法の適用事
例として、OKI プリンターのお問合せコール分析の事例
について紹介し、最後に、今後の取り組みや方向性につい
て述べる。
テキストマイニング技術
従来、お客様アンケートや電話の応対記録等の分析作
業は、人間が読んでその傾向を把握したり、分類する必要
な曖昧性を解消したりする「言語処理技術」1)と、データ
成されている。図 1 のように「統計処理技術」には様々な
手法があるが、目的によって利用すべき手法は異なる。例
えば、既存の分類項目に従って文書を自動分類したい場
合は「カテゴライジング」手法を利用する。また、類似した
文書を集めたい場合は「クラスタリング」手法を利用する。
このように、単語や句の出現の統計的な傾向をみるこ
とによって、その文書には、どのような内容が書かれてい
るかを知ることができたり、お客様のタイプや時期によ
る特徴を掴んだりすることができる。
テキストマイニング技術は、既にツール化され、市販さ
れている。しかし、市販のツールを使ったとしても、要素
技術の専門性が高く、かつ、分析目的に応じた手法の駆使
が求められるため、ビジネス上有益な結果を得るために
は、長期的な分析ノウハウの蓄積と試行錯誤が必要であ
る場合が多い。
インバウンドコールログを分析するための観点
我々は、インバウンドのコールログの特徴を捉えた分
析観点を 4 つ設定した。
・分析観点 1. お客様の問合せの目的
・分析観点 2. 問合せの真の理由
・分析観点 3. 問合せの真の対象製品、機能、サービス
・分析観点 4. 対応結果
があった。そのため、コストがかかり、かつ分析者の主観
が入ることも多く、継続的な分析を行うことが難しかっ
インバウンドのコールログは、お客様が電話するに
る単位(単語や句)に機械的に分解することで、単語や句
できる。図 2 は、「お客様の問合せの目的」の基本分類で
「テキストマイニング技術」は、非定型の文章を意味あ
を 1 つのデータとみなし、単語や句の出現頻度やそれら
の関係性を統計的に分析する技術である。
図 1 に、テキストマイニング技術を模式化した図を示
す。この図のようにテキストマイニング技術は、文章を単
38
(1)分析観点 1. お客様の問合せの目的
た。
OKI テクニカルレビュー
2016 年 5 月/第 227 号 Vol.83 No.1
至った目的が必ず存在し、その目的は一般化することが
ある。購入後のお客様は、お客様自身が困っているのか?
(図 2 ②)
、それとも情報が欲しいのか?(図 2 ③)
、何ら
かの手続きをして欲しいのか?(図 2 ④⑤)に大まかに
分類することができる。
䝔䜻䝇䝖䝬䜲䝙䞁䜾ᢏ⾡
኱
㔞
䛾
ᩥ
᭩
౛䠖▷⦰䝎䜲䝲䝹䛜㏦ಙ䛷䛝䜎
㻌㻌㻌㻌㻌䛫䜣
ᙧែ⣲ゎᯒ䠖༢ㄒ༢఩䛻ศ๭䛧䚸
ᶆ‽ᙧ䛻⤫୍䛩䜛䚹༢ㄒ䛾ရモ䜢
᥎ᐃ䛩䜛䚹
౛䠖 ▷⦰(ྡモ)/䝎䜲䝲䝹(ྡモ)
䛜(ຓモ)/㏦ಙ䛩䜛(ືモ)/䛷䛝䛺䛔
(ຓືモ)
䜹䝔䝂䝷䜲䝆䞁䜾䠖᪤Ꮡ䛾
ศ㢮㡯┠䛻ᚑ䛳䛶ᩥ᭩䜢
ศ㢮䛩䜛
䜽䝷䝇䝍䝸䞁䜾䠖㢮ఝ䛩䜛
䜒䛾ྠኈ䜢㞟䜑䛶ᩥ᭩䜢
༢఩㻔䜽䝷䝇䝍㻕ẖ䛻ศ䛡䜛
㻲㻭㼄
ᑓ㛛⏝ㄒᢳฟ䠖䛭䛾ᩥ᭩䛻≉ᚩⓗ
䛻ฟ⌧䛩䜛⏝ㄒ䜢ᢳฟ䛩䜛
౛䠖 ▷⦰䝎䜲䝲䝹
≉ᚩㄒᢳฟ䠖ᩥ᭩䛻≉ᚩ
ⓗ䛺༢ㄒ䜔ྃ䜢ᢳฟ䛩䜛
ಀ䜚ཷ䛡ゎᯒ䠖༢ㄒ㛫䛾ಀཷ䛡䜢
᥎ᐃ䛧䚸ព࿡䛒䜛༢఩䛻䜎䛸䜑䜛
౛䠖▷⦰䝎䜲䝲䝹 ㏦ಙ䛷䛝䛺䛔
༢ㄒ㛫㛵㐃ᗘศᯒ䠖༢ㄒ
䛾ྠ᫬ฟ⌧๭ྜ䛛䜙༢ㄒ
ྠኈ䛾㛵㐃ᗘ䜢ồ䜑䜛
䠖
(䛜)
▷⦰䝎䜲䝲䝹
㏦ಙ
ཷಙ
㏦ཷಙ
ඖ䛾ᩥ᭩䛻
ᐜ᫆䛻䛯䛹䜛
䛣䛸䛜䛷䛝䜛
䠖
---------------------------ཎᩥ
図 1 テキストマイニング技術
(2)分析観点 2. 問合せの真の理由
䠍䠊 䛚ᐈᵝ䛾ၥྜ䛫䛾┠ⓗ䛿ఱ䛛䠛
䞉㉎ධ᳨ウ
䐟 〇ရ䠄䝃䞊䝡䝇䠅䛻䛴䛔䛶䛾᝟ሗ䛜ḧ䛧䛔
䞉㉎ධᚋ
䐠 〇ရ䠄䝃䞊䝡䝇䠅䛜౑䛘䛺䛟䛶ᅔ䛳䛶䛔䜛
䐡 〇ရ䠄䝃䞊䝡䝇䠅䛿౑䛘䜛䛜䚸౑䛔䜔䛩䛟
䛩䜛䛯䜑䛻䛥䜙䛺䜛᝟ሗ䛜ḧ䛧䛔
䐢 ዎ⣙䜢ኚ᭦䛧䛯䛔 㻌
䐣 ㏉ရ䛧䛯䛔䚸ゎ⣙䛧䛯䛔
䐤 ௚䛾〇ရ䠄䝃䞊䝡䝇䠅䛻䛴䛔䛶䛾᝟ሗ䛜
ḧ䛧䛔
䐥 䛭䛾௚䠄䝃䞊䝡䝇䜈䛾せᮃ䚸䛚♩䠅
䞉䛭䛾௚䛾䛚ᐈᵝ
䐦 䛭䛾௚䠄ពぢ䚸ⱞ᝟䠅
図 2 分析観点 1. お客様の問合せの目的 の基本分類
これらの項目は、さらに、何に困っているのか、何の情
報が欲しいのかの「何」によって、さらに詳細な分類をす
ることができる。
本観点での分析により、その製品やサービスに関する
お客様の関心や困り事を直接知ることができ、FAQ 集の
作成に利用することができる。
お客様が、あるサービスや機能が使えず、故障修理のた
めに電話した場合であっても、コールセンターのオペ
レーターとのやりとりの中で、実はお客様の設定ミスで
あったり、別のサービスが原因であったりすることはよ
くあることである。
お客様が問合せした目的とともに、最終的にお客様が
電話する原因となった真の理由を知ることは、今後の
サービスや製品の問題を浮き彫りにし、解決すべき課題
を示唆する。
分析観点 1. はお客様視点による分類であるのに対して、
本観点は、製品やサービス提供者側の視点による分類で
ある。例えば、
「ユーザー登録」、
「xx設定不備」のように、
製品やサービスに依存した項目となる。
問合せの真の理由をコールから見つけるためには、お
客様の問合せ内容だけでなく、オペレーターがどのよう
な対応を行なったのかの両方の内容を含むコールログを
利用する。
(3)分析観点 3. 問合せの真の対象製品、機能、サービス
お客様の問合せには、問合せの対象となる製品やサー
ビスがある。製品名やサービス名はコールの受付の際、自
動応答でお客様自身が選択したり、コールを受けるオペ
レーターが後処理で記録している場合が多いが、これは
O KI テクニカルレビュー
2016 年 5 月/第 227 号 Vol.83 No.1
39
お客様やオペレーターの主観に基づいて入力されており
上記の 4 つの観点には、「購入前相談」では「修理」は有
る値ではなく、対象となる製品やサービス名をテキスト
性のある対応結果を見つけたいため分類項目の依存関係
基準が一定でない。このため、既にコールに付与されてい
マイニング技術により決定する。
なお製品やサービス名は、商品化の際、機能や目的別に
体系化されていることが多く、その体系を直接テキスト
マイニングで使用する。
り得ないというように項目間に依存関係があるが、意外
は考慮せず独立に自動分類する。
次に、自動分類の結果から、観点別に各項目における増
減の変化を時系列で確認したり、分析観点間で掛け合わ
せて分析する事により、どのようなお客様の困り事がど
のような根本原因(真の原因)に紐づいているか、さらに
(4)分析観点 4. 対応結果
お客様の問合せに対して、コールセンターのオペレー
ターが最終的に、どのように対処したかを分析する。イン
バウンドのコールセンターでは、
A ) オペレーターの説明で解決するもの
B ) お客様になんらかの作業をお願いするもの
C ) サービス(製品)提供者側の作業が伴うもの
に大別される。さらに A )~ C )は、個々の製品やサービ
スに応じて細分化される。
䝣䜱䞊䝗䝞䝑䜽㻌
はどのようなお客様の困り事に対してどのような対処を
行なっているかを確認する(図 3 の Step2)
。さらに、注目
すべきお客様の困り事に対しては、その困り事に対応す
るコールログを抽出し、出現する単語の係り受け関係を
ネットワークとして可視化したり、その困り事だけに特
徴的に出現する単語や表現を確認したり、コールログを
直 接 確 認 し た り し て 問 題 の 深 堀 り を 行 な う( 図 3 の
Step3)
。
OKI プリンターにおけるコールログ分析
OKI の 複 合 機・プ リ ン タ ー 向 け 新 サ ー ビ ス で あ る
㛵ಀ⪅䜈䛾䝠䜰䝸䞁䜾
ศᯒほⅬ䛾ᨵⰋ
Step 1
⮬ືศ㢮䠄䜹䝔䝂䝷䜲䝆䞁䜾䠅
Step 2
䐟 ศ㢮㡯┠㛫䛾䜽䝻䝇ศᯒ
䐠 ᫬⣔ิศᯒ
Step 3
ヲ⣽ศᯒ䚷䠄㼑㼤㻚㻌≉ᚩㄒᢳฟ䚸
༢ㄒ㛫㛵㐃ᗘศᯒ䠅
「COREFIDO3」*1)は、「メンテナンスバリアフリー設計」
と「クラウドメンテナンスプラットフォーム」を採用する
ことによって、オフィスにおけるプリンターメンテナン
スのコスト削減を実現した製品である 2)。
プリンターのメンテナンス性を向上させるためには、
お客様が利用する現場で、どのような問題が生じている
のかを知り、その対策を講じることが重要である 3)。我々
は、その目的のために、上述のテキストマイニング技術を
用いたコールログ分析を行っている。分析の進め方は図
3 に従う。
Step1 の自動分類(カテゴライジング)
は、SVM(サポー
トベクターマシン)という教師有り機械学習の手法を用
いた。「教師有り機械学習」とは、既に人間によって分類
済みのコールログから、分類の決め手となるワードの出
現状況を自動的に学習し、未知のコールログに対しても
自動的に分類する手法である。教師となる分類済みの
図 3 コールログの分析ステップ
コールログの分析の流れを図 3 に示す。インバウンド
のコールログは、まず上記の 1. ~ 4. の分析観点毎に分類
項目を作成する。分析観点 1. は、①~⑧を基に、分析観点
4. は A )~ C )を基に分類する。また、分析観点 2. と 3. は
製品やサービスに依存した分類項目となる。予め設定し
た分類項目別に、図 1 の統計処理技術の「カテゴライジン
ク」の技術を用いて自動分類する(図 3 の Step1)
。
*1)
「COREFIDO」は株式会社沖データの登録商標です。
40
OKI テクニカルレビュー
2016 年 5 月/第 227 号 Vol.83 No.1
コールログの作成は、最初はランダムに収集したコール
ログ 200 件を用いたが、実用に耐えうるとされる分類精
度を得るために、現在では、1,000 件まで増強したものを
用いて自動分類を行っている。
さらに分析の精度を向上させる試みとして、以下の 3
点を行っている。
(1)既存テキストからの専門用語辞書の半自動作成
テキストマイニングの基本となる単位は単語である。
分析対象のコールに出現する単語を適切な単位で分割、
い。特に、購入前のお客様は複数の製品やサービスに関す
門用語抽出ツール を応用して、プリンターマニュアル
主となる内容の 1 つの分類項目を付与するだけでなく、
認識することは自動分類の精度向上に役立つ。我々は、専
4)
やコールログから、コールログに出現しやすい用語を抽
出し、これらの用語は 1 単語として認識する。
図 4 に、プリンターマニュアルから専門用語抽出ツー
る質問を同時にすることが多い。1 件の問合せに対して、
複数の話題があった場合は複数の分類項目を付与する手
法も用意し、分析の目的に応じて使い分けている。
ルを用いて抽出した 6 文字以上の専門用語上位 20 語を
示す。抽出結果には、図 4 下線の「症状確認項目対処方法
参照ページ」のような抽出ミスも含まれるため、目視確認
し、抽出ミスは除いて辞書に登録している。
⤥⣬䝻䞊䝷䞊
ᐃ╔ჾ䝴䝙䝑䝖
䝖䝘䞊䜹䞊䝖䝸䝑䝆
᧯స䝟䝛䝹
䝧䝹䝖䝴䝙䝑䝖
ཎ✏䜺䝷䝇
⮬ືཎ✏㏦䜚⿦⨨
䝛䝑䝖䝽䞊䜽タᐃ
䝯䝙䝳䞊㡯┠୍ぴ
䝯䞁䝔䝘䞁䝇䝴䝙䝑䝖
䜲䝯䞊䝆䝗䝷䝮䝴䝙䝑䝖
ཎ✏ᦙ㏦䝻䞊䝷䞊
䝥䝸䞁䝍䞊䝗䝷䜲䝞䞊
䝖䝑䝥䜹䝞䞊
⏝⣬䝖䝺䜲
䝯䝑䝉䞊䝆
䛚ᐈᵝ┦ㄯ䝉䞁䝍䞊
⑕≧☜ㄆ㡯┠ᑐฎ᪉ἲཧ↷䝨䞊䝆
ཎ✏䝖䝺䜲
䝇䜻䝱䝘䞊㒊
図 4 プリンターマニュアルからの専門用語抽出結果の例
おわりに
インバウンドのコールログを分析するための方法論と
して、4 つの分析観点(1. 問合せの目的、2. 真の理由、3. 真
の対象、4. 対応結果)を策定し、この観点に基づく自動分
類をベースとした分析ステップを提案した。半自動的に
作成した専門用語辞書や同義辞書を利用したり、複数の
自動分類手法を使い分けたりすることにより、分析精度
や効果を高めている。
提案手法を用いた OKI プリンターのお客様コールログ
分析は、現在継続的に行っており、その結果は、新製品の
仕様策定やサービスの改善に活かされている。
本稿で紹介した「COREFIDO3」はクラウドメンテナン
スプラットフォームを有している。今後は、クラウド内に
あるプリンターのエラー情報とコールログ情報を組み合
わせたマイニングに取組む予定である。 ◆◆
1)特集「自然言語処理技術の現状と展望」、情報処理学会
誌 , Vol.57 No.1 (2016)
2)前川 , 古原 , 植田 , 大山 , 鈴木:A3 LED カラー複合機
新 MC8 シ リ ー ズ , OKI テ ク ニ カ ル レ ビ ュ ー , No.226
(2)同義表現の吸収
通常、コールログ、つまり、お客様の問合せ内容記録は
コールセンターの後処理工程でオペレーターが入力する
ことが多いが、同じ内容でもユーザーやオペレーターに
よって表現方法は千差万別である。例えば、図 4 の「自動
原稿送り装置」は、ADF と表記されることが多い。また、
オペレーターにより入力されたコールログの場合は、入
力ミスや送り仮名の揺れも多い。この様な表現の揺れを
(2015)
3)高橋 , 石崎 , 岩瀬 , 開 , 細井:OKI のプリンター / 複合
機の操作性向上への取組み , OKI テクニカルレビュー ,
No.222 (2013)
4)下畑 , 山本:隣接文字のエントロピーに基づく定型表
現の自動抽出 , 沖電気研究開発 No.177 (1998)
統一するために、プリンターマニュアルやコールログを
北村美穂子:Mihoko Kitamura. 情報・技術本部 研究開発
これらの用語集は、
(1)の専門用語辞書と同様、コール
村田稔樹:Toshiki Murata. 情報・技術本部 研究開発セン
用いて、同義語辞書を作成し、分析に用いている。
ログ分析用辞書として管理、増強している。
(3)自動分類手法の拡張
お客様の 1 件の問合せにおいて、お客様の問合せ目的
や、話題の対象となる製品やサービスは 1 つとは限らな
センター センシング技術研究開発部
ター センシング技術研究開発部
佐々木美樹:Miki Sasaki. 情報・技術本部 研究開発セン
ター センシング技術研究開発部
奥村晃弘:Akihiro Okumura. 情報・技術本部 研究開発セ
ンター センシング技術研究開発部
O KI テクニカルレビュー
2016 年 5 月/第 227 号 Vol.83 No.1
41