知識理を駆使した線画イ象キ青報の言己述と玉里解 に関する研究

知識処理を駆使 した線画像情報 の記述 と理解
に関す る研究
渡部 豊 英
名古屋大学 工 学部
情報工学科 助 教授
1 . は じめ に
情報処理技術 の 著 しい発展 は、 さ らに多様で、高度 な情報 サ
ー ビスを実現可能 と して きた。言
ー
語情報 に限 らず、図形 ・画像情報、音声情報 を効果的に用 いて 、人間に優 しい対話 イ ンタフ ェ
スを実現 す ることも、近年重要 な課題 の 一 つ とな ってい る。人間 の情報活動 を積極的 に支援 で き
るためには、種 々の形態 ・構造 のデ ー タを格納 ・管理 し、様 々な要求 に対処で きる処理機能が必
要 であ る。 この よ うな計算機環境 を実現す るために、我 々は、
( 1 ) 線 画像 の構造 と意味 に関す る知識を利用す る高次知識 ベ ー スの構成
( 2 ) 線 画像情報 と言語情報 との相互変換 と共用
な どの課題を介 して、対処法 を考察 ・開発す る。
異種形態情報 の共用法 に関係す る。情報 システム
画像情報 の認識 ・理解法、課題( 2 ) は
課題 ( 1 ) は
デ ー タ ・リソー スの作成、課題( 2 ) は
の 処理機能か ら捉え ると、課題( 1 ) は
対話 インタフ ェー スの構
(2)に
関す る直接的な研究テ ー マ と して、デ ー タ ・
築 に対応付 ける ことがで きる。我 々は課題( 1 ) と
リツー スの 作成 に対 して図形 ・画像情報 の 認識 。理解を、対話 イ ンタフ ェー スの構築 に対 して言
語情報 と図形 ・画像情報 の共用 による対話 インタフェー スの 開発を、具体的 な研究 内容 と して採
り上 げた。
2 . 図 形 ・画像情報 の認識 ・理 解
情報 システムで 効果的 にデ ー タを処理す るには、様 々な情報を その意味の下 に構造化 しなけれ
, て的確 に意味 付 け、構造化で きれば、様 々な処理 要求 に も応ず る
ばな らな い。情報 をデ ー タと し
ことがで き、操 作す ることも容易であ るが、そ うでなければ処理 で きな い。 目的用途が明確 な 文
書 で は、比較的 この よ うな特性 を論理的に表現で きる場合が多 い。文書 に も様 々な形態
・様式 が
あ るが、 その 構造的 な特性 に従 って 次 の よ うに分類す る。
・文字文書
( a ) 図 書 目録 カー ド、名刺、文献 ニ ュー ス、論文 ・記事 なと : 各 デ ー クが空 白域で分離
( b ) 帳 票、集計表 な ど : 各 デ ー タが 枠罫線 で 分離
( C ) 新 聞 な と : 様 々な形状 のデ ー タが組み合わ さ って構成
( d ) 書 籍 の 表紙、 ち らしなど : 一 般 に、 様 々な形 のデ ー タが重 な り令 って 構成
・図形文書
( a ) 設 計 図、回路図な と : 構 成要素を明 示的 に定義 可能
( b ) 天 気図、地形図 など : 構 成要素 の 一 部予
Fケ
状を定義可能
一
々
宝f 〕
が 不規R 叫
白
( C ) 地 図 な ど : 構 成要素 の 部を定義可能で あ るが、構成空卓問の市 す
「
]
-18
一rlllllllllllllll
ldl 論文 な どの説 明図 など :構 成 要素を 一般的に定 義不可能
これ は文 許αD一般的な特徴の 下 に分灯〔
したが、 文書 によ って は必 ず しも明確 に区分 され る訳で は
ない,あ る文キ には文字 と図,「
夕・山i像が況 合 されて いた り、あ る文 書 には明確 に識別で きる特徴
が観 察 され ない場 合 もあ る│―しか し、 文字 文書 と図形 文書で は構成的に大 きな特徴を観察で きる
。
文字文書で は書式構造が│↓符 して 、個 々の 構成要素をあ る程度区分で きるのに対 して、 図形文書
で はそれが 観察 されず に、 個 々の構成要素 の組合せによ って 様 々に表現 されて い る。従 って、
ど
の よ うな レベル か ら文書 の特徴を捉え るかによ り、異な った認識処理の アプ ロー チが
必要 にな る。
文書理解 の 枠組みを図 1に 示す.
これ らを 使宜 的 に、文 書 に関す る J次 元的、2次 元的、1次 元的、0次 元的情
報を用 い た処理
と して捉 えれば、 文書理解のための活用知識が 明確 になる。文書種別 は各種文書の
種類、及 び他
とは異にす る文章個 々の 利用用途別 の特徴 によ り識別 され るc書 式構造 は文字文書で は
明確 に区
分 され る場合が 多 く、 レイアウ ト構造が これ に対応す るが、図形文書では必ず しも書式構造が
明
碓 に観察 され ない.構 成要素 の 並 びは局所的 に隣接す る構成要素 の相互関係を表 し、 くの
多
文書
一
で は 定 の 規約 にチ
さづ いて 構成要素が並 べ られて い る。 文字文書では、 構成要素が項 目に対応 し、
論理的な行 におけ る項 目の 予び関係であ り、明確 に観察で きる場合が 多 い。 一 方、図形文書で は
構成要素が相互 に関連 して表記 され るときに観察 され る特徴であ るが、 明示的に表現 され ない
場
合が 多 い。構成要素の特性 は、 文字文書で は個 々の項 目のデ ー タ集合 の特徴であ り、図
形文書で
は個 々の 図形 要素 の 図形的な特 徴であ る。 これ らの情 報 は階層的に構成 され、
大域的な情 報か ら
局所的な情 報を表す。
計算機で様 々な文書を処理す る場合、 これ らの情 報を知識 と して 利用す ることによ り、効率 よ
く認識で きる。 具体的な処理 アプ ローチを描 くと、図 2の よ うになるc文 字文書 と図
形文書で は、
1
素 子
―
『
1璃轄‐
覇■
文書型 の認識
書式構造の認識
―
ん
構成要素の認識
堕碑
F―
春
羨
全
簿
繕
繍虚
文字 ・記号 の 認識
ら
1 図1
文書理解の ための枠組み
( 移イ
千)
囲
b?為
キ
糾jup
処理対称が有す る情報 レベル ( 書式, 図 式 な どの形式) が 異 なるために、 モデル を構成で きるか
ー
否 か、 また知識 と して明示 で きるか 否 かが 叉な って 、多少 アプ ロ チが 相違す る. し か し、様 々
・
な レベ ルの 知識 を用 いて段階的 に認識す べ き内容を規定 し、分類 抽 出す ることがで きる. こ の
アプ ロー チにお いて 、 ボ トム ・ア ップ処理 は線図形 の よ うに、予 め処理 対象を明確 に規定で きな
・
い場合、直接文書 画像を処理 して図形 要素 を抽 出す るプ ロセスを表す。 一 方、ト ップ ダウ ン処
理 は予め処理対象 に関す る様 々な情報を処理 プ ロセスに保持 させ、文書画像 を解釈す るプ ロセス
を表す。 一 般 に、文字文書 は書式構 造が明確 なために、予め書式構造 に関す る情報を知識 と して
ー
処理 システムに蓄積す ることによ り、 モ デ ル駆動型 のアプ ロ チで 対処 で きるが、図形文書 は個
々の 図形要素 を概念的 に しか意味付けで きないために、それ よ り上位 ( 1 次 元以上) の 情報 を得
ー
ー
るためにはボ トム ・ア ップ的 に文書画像 を処理す る必要があ り、 デ タ駆動型 の アプ ロ チ とな
る。
1 ) 文 字文書 と して の 図書 目録 カー ドの 処理
ー
図書 目録 カ ー ドの文書画像 か ら図 1 に 示 した レベルの知識 を用 いて 、 目録項 ロデ タを分類
ー
して抽 出 した。実際 に、5 0 枚の和書 目録 カ ドを用 いて 実験 したが、 ほぼ完全 に処理で きたc
す なわ ち、文字 の認識率 は9 8 % で あ った。 これを従来 の文字認識技術 に基 づ いた方法 で処理す
ると8 9 % と な り、我 々の方法 による効果が明 らかであ る。 また、 その処理時間を、従来 の方法
に比 べ て 約 1 / 2 1 / 3 に短縮で きる ことが 明 らか とな った。
この 方法 は他 の 文書、 た とえば名刺、文献 リス ト、書籍 な どに も容 易 に適用で きる。 もちろ
ん、帳 票、新 聞紙 、広告 カタ ロ グなどには必ず しもそのまま適 合 で きな いが 、書式構造 の 認識
ー
処理部を変 え ることによ り対応可能 であ る。本方法 は空 白域 で デ タの意味付 けが可能 な文書
ー
には何 ら問題 な く適用 で き、図書 目録 カ ドにて示 した。
2 ) 図 形文書 と して の市街地地 図 の 処理
・
・
市街地地図 の 処理で は、 ボ トム ア ップ処理 と トップ ダウ ン処理 を融合 させて、補完的 に
一
構成 され るc ボ トム ・ア ップ処理 で、で きるだけ多 くの道路 を抽 出す ることも つの 方法 で あ
理 に用 い る しきい値 な どが地図画像 に大 き く依存
るが、 ボ トム ・ア ップだ けの 処理で は、( a ) 処
・
す る傾向 にあ り、他 の 地図画像 に柔軟 に適用で きな い. け 様 々な構成線分 要素 まで も抽 出 し
て しま い、局所的 な情報 が 多 く収集 で きるものの 、大域的 な情報 を選別す ることが難 しく、処
ー
理 を複雑 にす るなどの 問題 が生ず る。我 々の アプ ロ チで は、地図画像を大域的 に処理す るた
ー
めに誤 りを減 らす ことがで きる. す なわ ち、我 々のアプ ロ チは局所的 な情報を用 いたボ トム
・ア ップの画像処理 と、大域的 な情報を用 いた トップ ・ダウ ンの知識処理の統合であ り、処理
1 こ の よ うな アプ ロー チは 、機械部品 なとの設計図、人気図、地汗タ
結果 の正 当性 を保証で きる十
図 な どに も容易 に適用可能で あ る.
ー
3.言 語情報 と図形 ・画像情報 の共用 による対話 イ ンタフ ェ ス
情報 システムが人 間 の情報活動 を積極的に支援 で きるた めには、計算機 と人間 と'D情報交換 、
ー
操作環境 が 有機 的 に働 かなければな らな い。情報授受 の イ ンタフェ スが 重要 とな る。 人間 が 様
々な1 ド
f 報を析 々の 感覚器 を介 して送受 信で きるよ うに、情報 システムで も様 々な情報 を操 作 で き
な ければな らな い. こ れ らの情報 を処理 内容 、和l l l l の
者要求 に従 って効 果的 に用 い ることがで き
れば、人間 と占1 算機 の対話 インタフ ェー スは向上 す る‐
この よ うな祝点 に従 って、 人間 と言
十算機 の対 話 インタフェー スに従来 の 言語情報だけでな く、
図形 ・画像情報 を用 いて 操作環境 の 向上を図 るのが、 本研究課題であ る. 具 体的 には、天気図 に
関す る気象情報 の 問合 せ 、 市街地 におけ る経路の探 索 の情報 サ ー ビス ・システムを構成 し、図 形
・画像情報 と言語情 報を補完的に用 い る
方法 につ いて 検討 した. 言 語情報 と図形 ・画像情報 を統
合的 に意 味付けて管l r l し
、対話操 作 の指示 に従 って 効果的 に応 答で きる情報 システムを構築 した。
1 ) 天 気図 に関す る気象情報 の 問合せ
天気図 に関す る気 象イ
ト
市報 の 問合 せのための情報 システム ( 天気情報 システム) で は、 図形 ・
m i 像情報 と言語情 報 を共用 した対話 インクフェー スを構成す るとともに、 気象現象 に関す る様
々な問合せを 可能 とす る機能 を実現 した. 天 気情報 システムで は、 言語情報を介 した対話 イ ン
タフ ェー ス と同 時 に、 よ り視党的に情報を提示可能 とす るために、推論 された天 気図情報を図
式的 に示 し、よ り多様 な情報交換 の場間を実現 す ることが 目的である。 この場合、 言語情報 と
の 内容を表現す るので はな く、図形 ・画像情報 の 内容をよ り明確 に
図形 ・1 向
像情報が 全 く同 一
補足 で きるよ うに、言語 情報を生成す る必要があ る。天 気情報 システ ム は利用者か らの 問合 せ
要求 を受理 し、問 合せ内苓を満 たす情 報 または問 合せ 内容 に必 要 とされ る情報を天 気図 デ ー タ
ベ ー スか ら探索 し、 解釈す ることによ って応 合 デ ー タを作成 し、言語情報 と図形 ・画像情報 に
て 効果的 に提 示す る。大 気図 デ ー タベ ー スを探索処理す るだけでな く、気象現象、天 気図 に関
す る知 識 ベ ー スを用いて 推論処理す る。 人気情報 システ ム と して実現 したサ ー ビス機能 は次の
よ うで あ る.
・天気図 の 説明情報 ( 天気慨況)
・人気状況の推定 情報
図 8 に 、天 気状況 のl l l 定
情報 の提示例を示 したt
21
)
5域
↓ 推定(司
O DESUKA
l TOKORO ilA DO氏
101')TENl(1 OヽllARし
本州 南部 で は天気 は悪 い と思 われ ます.
子
近 で は、にわか雨 や言雨 な と激 しい現 象を と もな うと思われ ます ‐
」
客 冷前線 の イ
一
温R を
前線 の 楽 気回倒 ] 0 0 k m ぐらい まで、雨 か しと しと 様性 に降 ると思 われ ます
口 8 天 気状況 の推定1青報 の提示例
) 市 街地 におけ る道案 内情報 の探索
市街地 における道禁 内のための情報 システ ム ( 道案 内情報 システ ム) は 、あ る地点 ( 出発地)
か ら他 の地点 ( 日的地 ) へ 行 くの に最良経路 を探索す るご最良経路 は最矩経路を意味す るので
はな く、探索 者に と って 最 も解 り易 い と思われ る道路であ るっ た とえば、 車で は狭 い道路を選
ぶ よ りも、幹線道路 を経て 目的地 に至 る方 が好 ま しい. 道 採内情報 システ ム は、市仕i 地地図を
デー タベ ー スと して、様 々な 条件 を満 たす道路を探索す る. そ して、該 当す る経路を合む地域
を略図 と して 表示す るとともに、経路 を明示す るた めに略図 の補完情報 と して説明文を提示す
る こ れを実現す るために市 街地地図 の 内部 表現、最良経路 の探索、略図 の構成、補完的な説
明文の 作成 な どの課題を解決 した。図 1 に 、最良経路 に対す る略図 と説 明文の提示例を示 した。
1糾
=:3
-
!│
判。
と、仲 田 にで ます ―
そ こか ら、中 「
「
1 本l R l北をに向 か い ます . 東 市民病 院 前 に若 きます.
, 、菓 に向か い ます, そ して、次の 信号 の 千種 ろ う学校 、若水 中学 校 の 角 を■ に曲か
そ こか に
, ) てくだ さい. 寸 `
ると、次 の子種 ろ う学校 、若水 中学 校 の 角が 目的 の場所です.
図 1 略 図 と説 明文 の提示例
情報捉 示の 祝点 か ら、フ
ト
青報 システムにおける 言語情報 と図形 ・l n l 像
情報 の 共用 に関 して、天
気情 報 システム、道案 内情報 システムを採 り上 げた。 そ こで は、 図形 ・画像情報 とい う直観 的
で はあ るが、漠然 と したデ ー タに対 して、言語情報 とい う明示的な文章を補i 先的 に利用す る手
法を明 らか にで きた. ま た、 市衝地 における道 案 内ケ
1青
報 システムで は、 有効 に情報 を提示す る
ために略図を構 成す る方法 につ いて も検討 した。
情報 システムが 利用者の 要求 に応 じて情 報を的確 に提示で きることは、 よ りよ い対話 イ ンタ
フ ェー スを構成す る上で必 要不可欠であ る。図形 ・画像情報 を 補完す るとい う立場で言語情 報
の活 l l l 法
を検討 したが、 よ り有機的な対話 イ ンタフェー スの確立 には、マルチ メデ ィア情 報 を
構成す る個 々の情報 の 意味付 け とともに管理 する機構 も必要であ る。
4 . お わ りに
本稿 で は、知 識処理 を駆 使 した線画 像情報 の記述 と理 解 に関す る研究 と して、 言語情 報 と図 形
・画像情報 を作成 し、 利用 市r 能とす る″
1青
報 システムについて述 べ た. す なわ ち、情 報 システ ム に
お ける構築機能 と してデ ー ク ・1 , ツー スの 作成 と、 利用機能 と しての 対話 イ ンタ フ ェー スにつ い
て述 べ た。
211
文書 に も様 々な形態 ・様式 が あ り、複雑 な紙面 か ら如何 に有効 な情報を抽 出 ・分類す るか につ
いて 検討 す る必要があ る。我 々のアプ ロー チはその基 本的 な枠組み と して充分であ った。 また、
対話 イ ンタフ ェー スにお ける言語情報 と図形 ・画像情報 の有機的 な利用を考 え る場 合に、各種 の
情報 を相互 に意味 付 けて情報操作 に対 して等価的な意義を与え ることが必要 にな る。我 々の アプ
ロー チは情報 の活 用法 について も最 も基本的な枠組みを 与え た3 も ちろん、高次 イ ンタフ ェー ス
一
を有 した情報 システムを総 合的 に検討 した とき、我 々の研究課題 はその 部 の解決 を図 ったに過
ぎな い。 よ り大 きな祝点で、大域的 な立 場か ら個 々の 問題を考察 して いかな ければ な らな い。
1 識駆動方式 の 制御機構 の効率化、( 2 ) 一
般文書理解へ の適‖1 と機能拡大、( 3 )
文書理解 で は、( 1 ) 知
一
文書理解 システムの ユ ーザ ・イ ンタフ ェー ス開発 などを将来課題 と し、 方情報操作 のための対
能的 な情 報管理 などを将来課題 とす る
情報提示 イ ンタフェー ス、( 2 ) 機
話 イ ンタフ ェー スで は、( 1 ン
が、 本研究 の成果 の 下で発展的 に解決 して い く必要 がある。
謝辞 高 柳電子科学技術振興財団 の研究助成 によ り、以上 に報告 した数 々の成果を得 ることがで
きた。本研究課題 は、救吉 田雄 = _ 名古屋大学 工学部教授 が、福 村晃夫中京大学情報科学部教授
( 名古屋大学 名誉教授) の 推薦 の下 に計画 されたが、吉 田先生の突然の逝去 によ り、吉 回先生の
研究計画 の 下 に私報告者 が引 き継 いで 、 今日に至 った。吉 田先生の意図を充分 に結実 で きた訳で
はないが、 この 間引 き続 き ご支援 いただ いた貴財団 に心 よ り深謝 いた します。 また、始終 ご教示
・ご鞭縫 いただいた福村晃夫教授 にお 礼中 し上 げます。
公表論 文
Extractlon and
“
〔1 〕T.WATANABE, Q,Lし0, M.MIZOGAMI, Y.YOSHlDA, Y. INACAKl : Automatic
ledge bascd
Classificatloll oF Data ltems from Library Cataloging Cards by a Kllo‖
ApproachⅢ, Proc.of MIV-89, pp.67-71(1989).
",信
学技 報, P R U 8 9 1 2 6 , p p . 1 8
〔2 1 水 谷, 岡 部, 渡 辺 , 吉 田 : “等 高線 の 自動読 み取 り
(1990).
〔3 〕 早川 , 川 口. 渡 辺 , 吉 田 : “市街地地 図か らの 道路 ネ ッ トワー クの 構 成 とそれ に基づ い た道
"‐
機能 図形情 報 システ ム ・シ ンポ ジウム論 文集, p p . 1 1 1 1 1 6 ( 1 9 9 0 ) .
",情
処 ・情 報
1 1 , 丹羽 , 渡 辺 ‐ 古 田 : “道 案 内地 図情報 システ ム にお け る略 図 と文章 の 提 示法
路情 報 の 抽 出
システ 之、
報 告202,pp.18(1990).
ー
〔5 〕5 各, 渡 辺 , キ 凹‐ 稲 妊I : “田書 目録 カ ー ドを題 材 と した知 識 ベ ー ス ・アプ ロ チの 評価 に つ
いて
",信
学 技 報, P R U 9 0 8 , P P . 2 5 3 2 ( 1 9 9 0 ) `
〔6 〕丹 羽 , 吉 田, 福 村 : “道路網 の 階層 的表現 に もとづ く経路 探 索 アル ゴ リズ ム と地 図情 報 シス
テ ムヘ の応 ‖l " , 情 報 処 F 理
学 会 論文詰‐ 第 3 1 巻, 第 5 号 , p p . 6 5 9 6 6 6 ( 1 9 9 0 ) .
K.KAWACUCHl l “Rccognition of Roads in an Urban
〔7 , T.HAYAKAWA. T.WATAヽABE, Y.YOSHil)Aゃ
A'90, pp`215-218 (1990).
Map by Usillg the Topological Road Nctwork", Proc.of VⅥ
じ0, T,WA′
「
AヽABE` Y.YOSH illA, Y.AOAKI
1ヽ : “Recogllitlon or Document Structures on
〔8 , Q“Iク
the Basis of Spati31 and Ccometric Rclatiollships between Document items", Proc,of
MVA'90, pp.4()1-464 (1990).
Ⅲ
1 9 ! 略 . 渡 辺 . 吉 口. 稲 垣 ・ 斉 味 : “知 識 ベ ー スに基 づ い た図書 目録 カ ー ドの 理 解 Ⅲl 青報 処理
学 会 論 文誌 。 第 1 1 巻。 第 1 2 号. p p . 1 7 5 5 1 7 6 7 ( 1 9 9 0 ) 。
1 1 0 , 成 r t _ H監
‐, 金 井 、 渡辺 4 杉 江 t “帳 票 にお け る枠罫線 構造 の 記述 と認 識
',信
学 技報,
PRし
9 0 ■8 9 , p p . 3 9 1 6 ( 1 9 9 1 ) .
ABE, Q.しし0, Y.YOSHlDA‐Y. 1ヽ
AGAKl : hA Step、lse Recognitlon Method of
111: T,WATAヽ
iッ
ibrary Cataloging cards on the Basis of Varlous Kinds of Kno‖
ledge", Proc. of
10th IPCCC, pp.821-827 (1991)`
-25-