知識処理を駆使 した線画像情報 の記述 と理解 に関す る研究 渡部 豊 英 名古屋大学 工 学部 情報工学科 助 教授 1 . は じめ に 情報処理技術 の 著 しい発展 は、 さ らに多様で、高度 な情報 サ ー ビスを実現可能 と して きた。言 ー 語情報 に限 らず、図形 ・画像情報、音声情報 を効果的に用 いて 、人間に優 しい対話 イ ンタフ ェ スを実現 す ることも、近年重要 な課題 の 一 つ とな ってい る。人間 の情報活動 を積極的 に支援 で き るためには、種 々の形態 ・構造 のデ ー タを格納 ・管理 し、様 々な要求 に対処で きる処理機能が必 要 であ る。 この よ うな計算機環境 を実現す るために、我 々は、 ( 1 ) 線 画像 の構造 と意味 に関す る知識を利用す る高次知識 ベ ー スの構成 ( 2 ) 線 画像情報 と言語情報 との相互変換 と共用 な どの課題を介 して、対処法 を考察 ・開発す る。 異種形態情報 の共用法 に関係す る。情報 システム 画像情報 の認識 ・理解法、課題( 2 ) は 課題 ( 1 ) は デ ー タ ・リソー スの作成、課題( 2 ) は の 処理機能か ら捉え ると、課題( 1 ) は 対話 インタフ ェー スの構 (2)に 関す る直接的な研究テ ー マ と して、デ ー タ ・ 築 に対応付 ける ことがで きる。我 々は課題( 1 ) と リツー スの 作成 に対 して図形 ・画像情報 の 認識 。理解を、対話 イ ンタフ ェー スの構築 に対 して言 語情報 と図形 ・画像情報 の共用 による対話 インタフェー スの 開発を、具体的 な研究 内容 と して採 り上 げた。 2 . 図 形 ・画像情報 の認識 ・理 解 情報 システムで 効果的 にデ ー タを処理す るには、様 々な情報を その意味の下 に構造化 しなけれ , て的確 に意味 付 け、構造化で きれば、様 々な処理 要求 に も応ず る ばな らな い。情報 をデ ー タと し ことがで き、操 作す ることも容易であ るが、そ うでなければ処理 で きな い。 目的用途が明確 な 文 書 で は、比較的 この よ うな特性 を論理的に表現で きる場合が多 い。文書 に も様 々な形態 ・様式 が あ るが、 その 構造的 な特性 に従 って 次 の よ うに分類す る。 ・文字文書 ( a ) 図 書 目録 カー ド、名刺、文献 ニ ュー ス、論文 ・記事 なと : 各 デ ー クが空 白域で分離 ( b ) 帳 票、集計表 な ど : 各 デ ー タが 枠罫線 で 分離 ( C ) 新 聞 な と : 様 々な形状 のデ ー タが組み合わ さ って構成 ( d ) 書 籍 の 表紙、 ち らしなど : 一 般 に、 様 々な形 のデ ー タが重 な り令 って 構成 ・図形文書 ( a ) 設 計 図、回路図な と : 構 成要素を明 示的 に定義 可能 ( b ) 天 気図、地形図 など : 構 成要素 の 一 部予 Fケ 状を定義可能 一 々 宝f 〕 が 不規R 叫 白 ( C ) 地 図 な ど : 構 成要素 の 部を定義可能で あ るが、構成空卓問の市 す 「 ] -18 一rlllllllllllllll ldl 論文 な どの説 明図 など :構 成 要素を 一般的に定 義不可能 これ は文 許αD一般的な特徴の 下 に分灯〔 したが、 文書 によ って は必 ず しも明確 に区分 され る訳で は ない,あ る文キ には文字 と図,「 夕・山i像が況 合 されて いた り、あ る文 書 には明確 に識別で きる特徴 が観 察 され ない場 合 もあ る│―しか し、 文字 文書 と図形 文書で は構成的に大 きな特徴を観察で きる 。 文字文書で は書式構造が│↓符 して 、個 々の 構成要素をあ る程度区分で きるのに対 して、 図形文書 で はそれが 観察 されず に、 個 々の構成要素 の組合せによ って 様 々に表現 されて い る。従 って、 ど の よ うな レベル か ら文書 の特徴を捉え るかによ り、異な った認識処理の アプ ロー チが 必要 にな る。 文書理解 の 枠組みを図 1に 示す. これ らを 使宜 的 に、文 書 に関す る J次 元的、2次 元的、1次 元的、0次 元的情 報を用 い た処理 と して捉 えれば、 文書理解のための活用知識が 明確 になる。文書種別 は各種文書の 種類、及 び他 とは異にす る文章個 々の 利用用途別 の特徴 によ り識別 され るc書 式構造 は文字文書で は 明確 に区 分 され る場合が 多 く、 レイアウ ト構造が これ に対応す るが、図形文書では必ず しも書式構造が 明 碓 に観察 され ない.構 成要素 の 並 びは局所的 に隣接す る構成要素 の相互関係を表 し、 くの 多 文書 一 で は 定 の 規約 にチ さづ いて 構成要素が並 べ られて い る。 文字文書では、 構成要素が項 目に対応 し、 論理的な行 におけ る項 目の 予び関係であ り、明確 に観察で きる場合が 多 い。 一 方、図形文書で は 構成要素が相互 に関連 して表記 され るときに観察 され る特徴であ るが、 明示的に表現 され ない 場 合が 多 い。構成要素の特性 は、 文字文書で は個 々の項 目のデ ー タ集合 の特徴であ り、図 形文書で は個 々の 図形 要素 の 図形的な特 徴であ る。 これ らの情 報 は階層的に構成 され、 大域的な情 報か ら 局所的な情 報を表す。 計算機で様 々な文書を処理す る場合、 これ らの情 報を知識 と して 利用す ることによ り、効率 よ く認識で きる。 具体的な処理 アプ ローチを描 くと、図 2の よ うになるc文 字文書 と図 形文書で は、 1 素 子 ― 『 1璃轄‐ 覇■ 文書型 の認識 書式構造の認識 ― ん 構成要素の認識 堕碑 F― 春 羨 全 簿 繕 繍虚 文字 ・記号 の 認識 ら 1 図1 文書理解の ための枠組み ( 移イ 千) 囲 b?為 キ 糾jup 処理対称が有す る情報 レベル ( 書式, 図 式 な どの形式) が 異 なるために、 モデル を構成で きるか ー 否 か、 また知識 と して明示 で きるか 否 かが 叉な って 、多少 アプ ロ チが 相違す る. し か し、様 々 ・ な レベ ルの 知識 を用 いて段階的 に認識す べ き内容を規定 し、分類 抽 出す ることがで きる. こ の アプ ロー チにお いて 、 ボ トム ・ア ップ処理 は線図形 の よ うに、予 め処理 対象を明確 に規定で きな ・ い場合、直接文書 画像を処理 して図形 要素 を抽 出す るプ ロセスを表す。 一 方、ト ップ ダウ ン処 理 は予め処理対象 に関す る様 々な情報を処理 プ ロセスに保持 させ、文書画像 を解釈す るプ ロセス を表す。 一 般 に、文字文書 は書式構 造が明確 なために、予め書式構造 に関す る情報を知識 と して ー 処理 システムに蓄積す ることによ り、 モ デ ル駆動型 のアプ ロ チで 対処 で きるが、図形文書 は個 々の 図形要素 を概念的 に しか意味付けで きないために、それ よ り上位 ( 1 次 元以上) の 情報 を得 ー ー るためにはボ トム ・ア ップ的 に文書画像 を処理す る必要があ り、 デ タ駆動型 の アプ ロ チ とな る。 1 ) 文 字文書 と して の 図書 目録 カー ドの 処理 ー 図書 目録 カ ー ドの文書画像 か ら図 1 に 示 した レベルの知識 を用 いて 、 目録項 ロデ タを分類 ー して抽 出 した。実際 に、5 0 枚の和書 目録 カ ドを用 いて 実験 したが、 ほぼ完全 に処理で きたc す なわ ち、文字 の認識率 は9 8 % で あ った。 これを従来 の文字認識技術 に基 づ いた方法 で処理す ると8 9 % と な り、我 々の方法 による効果が明 らかであ る。 また、 その処理時間を、従来 の方法 に比 べ て 約 1 / 2 1 / 3 に短縮で きる ことが 明 らか とな った。 この 方法 は他 の 文書、 た とえば名刺、文献 リス ト、書籍 な どに も容 易 に適用で きる。 もちろ ん、帳 票、新 聞紙 、広告 カタ ロ グなどには必ず しもそのまま適 合 で きな いが 、書式構造 の 認識 ー 処理部を変 え ることによ り対応可能 であ る。本方法 は空 白域 で デ タの意味付 けが可能 な文書 ー には何 ら問題 な く適用 で き、図書 目録 カ ドにて示 した。 2 ) 図 形文書 と して の市街地地 図 の 処理 ・ ・ 市街地地図 の 処理で は、 ボ トム ア ップ処理 と トップ ダウ ン処理 を融合 させて、補完的 に 一 構成 され るc ボ トム ・ア ップ処理 で、で きるだけ多 くの道路 を抽 出す ることも つの 方法 で あ 理 に用 い る しきい値 な どが地図画像 に大 き く依存 るが、 ボ トム ・ア ップだ けの 処理で は、( a ) 処 ・ す る傾向 にあ り、他 の 地図画像 に柔軟 に適用で きな い. け 様 々な構成線分 要素 まで も抽 出 し て しま い、局所的 な情報 が 多 く収集 で きるものの 、大域的 な情報 を選別す ることが難 しく、処 ー 理 を複雑 にす るなどの 問題 が生ず る。我 々の アプ ロ チで は、地図画像を大域的 に処理す るた ー めに誤 りを減 らす ことがで きる. す なわ ち、我 々のアプ ロ チは局所的 な情報を用 いたボ トム ・ア ップの画像処理 と、大域的 な情報を用 いた トップ ・ダウ ンの知識処理の統合であ り、処理 1 こ の よ うな アプ ロー チは 、機械部品 なとの設計図、人気図、地汗タ 結果 の正 当性 を保証で きる十 図 な どに も容易 に適用可能で あ る. ー 3.言 語情報 と図形 ・画像情報 の共用 による対話 イ ンタフ ェ ス 情報 システムが人 間 の情報活動 を積極的に支援 で きるた めには、計算機 と人間 と'D情報交換 、 ー 操作環境 が 有機 的 に働 かなければな らな い。情報授受 の イ ンタフェ スが 重要 とな る。 人間 が 様 々な1 ド f 報を析 々の 感覚器 を介 して送受 信で きるよ うに、情報 システムで も様 々な情報 を操 作 で き な ければな らな い. こ れ らの情報 を処理 内容 、和l l l l の 者要求 に従 って効 果的 に用 い ることがで き れば、人間 と占1 算機 の対話 インタフ ェー スは向上 す る‐ この よ うな祝点 に従 って、 人間 と言 十算機 の対 話 インタフェー スに従来 の 言語情報だけでな く、 図形 ・画像情報 を用 いて 操作環境 の 向上を図 るのが、 本研究課題であ る. 具 体的 には、天気図 に 関す る気象情報 の 問合 せ 、 市街地 におけ る経路の探 索 の情報 サ ー ビス ・システムを構成 し、図 形 ・画像情報 と言語情 報を補完的に用 い る 方法 につ いて 検討 した. 言 語情報 と図形 ・画像情報 を統 合的 に意 味付けて管l r l し 、対話操 作 の指示 に従 って 効果的 に応 答で きる情報 システムを構築 した。 1 ) 天 気図 に関す る気象情報 の 問合せ 天気図 に関す る気 象イ ト 市報 の 問合 せのための情報 システム ( 天気情報 システム) で は、 図形 ・ m i 像情報 と言語情 報 を共用 した対話 インクフェー スを構成す るとともに、 気象現象 に関す る様 々な問合せを 可能 とす る機能 を実現 した. 天 気情報 システムで は、 言語情報を介 した対話 イ ン タフ ェー ス と同 時 に、 よ り視党的に情報を提示可能 とす るために、推論 された天 気図情報を図 式的 に示 し、よ り多様 な情報交換 の場間を実現 す ることが 目的である。 この場合、 言語情報 と の 内容を表現す るので はな く、図形 ・画像情報 の 内容をよ り明確 に 図形 ・1 向 像情報が 全 く同 一 補足 で きるよ うに、言語 情報を生成す る必要があ る。天 気情報 システ ム は利用者か らの 問合 せ 要求 を受理 し、問 合せ内苓を満 たす情 報 または問 合せ 内容 に必 要 とされ る情報を天 気図 デ ー タ ベ ー スか ら探索 し、 解釈す ることによ って応 合 デ ー タを作成 し、言語情報 と図形 ・画像情報 に て 効果的 に提 示す る。大 気図 デ ー タベ ー スを探索処理す るだけでな く、気象現象、天 気図 に関 す る知 識 ベ ー スを用いて 推論処理す る。 人気情報 システ ム と して実現 したサ ー ビス機能 は次の よ うで あ る. ・天気図 の 説明情報 ( 天気慨況) ・人気状況の推定 情報 図 8 に 、天 気状況 のl l l 定 情報 の提示例を示 したt 21 ) 5域 ↓ 推定(司 O DESUKA l TOKORO ilA DO氏 101')TENl(1 OヽllARし 本州 南部 で は天気 は悪 い と思 われ ます. 子 近 で は、にわか雨 や言雨 な と激 しい現 象を と もな うと思われ ます ‐ 」 客 冷前線 の イ 一 温R を 前線 の 楽 気回倒 ] 0 0 k m ぐらい まで、雨 か しと しと 様性 に降 ると思 われ ます 口 8 天 気状況 の推定1青報 の提示例 ) 市 街地 におけ る道案 内情報 の探索 市街地 における道禁 内のための情報 システ ム ( 道案 内情報 システ ム) は 、あ る地点 ( 出発地) か ら他 の地点 ( 日的地 ) へ 行 くの に最良経路 を探索す るご最良経路 は最矩経路を意味す るので はな く、探索 者に と って 最 も解 り易 い と思われ る道路であ るっ た とえば、 車で は狭 い道路を選 ぶ よ りも、幹線道路 を経て 目的地 に至 る方 が好 ま しい. 道 採内情報 システ ム は、市仕i 地地図を デー タベ ー スと して、様 々な 条件 を満 たす道路を探索す る. そ して、該 当す る経路を合む地域 を略図 と して 表示す るとともに、経路 を明示す るた めに略図 の補完情報 と して説明文を提示す る こ れを実現す るために市 街地地図 の 内部 表現、最良経路 の探索、略図 の構成、補完的な説 明文の 作成 な どの課題を解決 した。図 1 に 、最良経路 に対す る略図 と説 明文の提示例を示 した。 1糾 =:3 - !│ 判。 と、仲 田 にで ます ― そ こか ら、中 「 「 1 本l R l北をに向 か い ます . 東 市民病 院 前 に若 きます. , 、菓 に向か い ます, そ して、次の 信号 の 千種 ろ う学校 、若水 中学 校 の 角 を■ に曲か そ こか に , ) てくだ さい. 寸 ` ると、次 の子種 ろ う学校 、若水 中学 校 の 角が 目的 の場所です. 図 1 略 図 と説 明文 の提示例 情報捉 示の 祝点 か ら、フ ト 青報 システムにおける 言語情報 と図形 ・l n l 像 情報 の 共用 に関 して、天 気情 報 システム、道案 内情報 システムを採 り上 げた。 そ こで は、 図形 ・画像情報 とい う直観 的 で はあ るが、漠然 と したデ ー タに対 して、言語情報 とい う明示的な文章を補i 先的 に利用す る手 法を明 らか にで きた. ま た、 市衝地 における道 案 内ケ 1青 報 システムで は、 有効 に情報 を提示す る ために略図を構 成す る方法 につ いて も検討 した。 情報 システムが 利用者の 要求 に応 じて情 報を的確 に提示で きることは、 よ りよ い対話 イ ンタ フ ェー スを構成す る上で必 要不可欠であ る。図形 ・画像情報 を 補完す るとい う立場で言語情 報 の活 l l l 法 を検討 したが、 よ り有機的な対話 イ ンタフェー スの確立 には、マルチ メデ ィア情 報 を 構成す る個 々の情報 の 意味付 け とともに管理 する機構 も必要であ る。 4 . お わ りに 本稿 で は、知 識処理 を駆 使 した線画 像情報 の記述 と理 解 に関す る研究 と して、 言語情 報 と図 形 ・画像情報 を作成 し、 利用 市r 能とす る″ 1青 報 システムについて述 べ た. す なわ ち、情 報 システ ム に お ける構築機能 と してデ ー ク ・1 , ツー スの 作成 と、 利用機能 と しての 対話 イ ンタ フ ェー スにつ い て述 べ た。 211 文書 に も様 々な形態 ・様式 が あ り、複雑 な紙面 か ら如何 に有効 な情報を抽 出 ・分類す るか につ いて 検討 す る必要があ る。我 々のアプ ロー チはその基 本的 な枠組み と して充分であ った。 また、 対話 イ ンタフ ェー スにお ける言語情報 と図形 ・画像情報 の有機的 な利用を考 え る場 合に、各種 の 情報 を相互 に意味 付 けて情報操作 に対 して等価的な意義を与え ることが必要 にな る。我 々の アプ ロー チは情報 の活 用法 について も最 も基本的な枠組みを 与え た3 も ちろん、高次 イ ンタフ ェー ス 一 を有 した情報 システムを総 合的 に検討 した とき、我 々の研究課題 はその 部 の解決 を図 ったに過 ぎな い。 よ り大 きな祝点で、大域的 な立 場か ら個 々の 問題を考察 して いかな ければ な らな い。 1 識駆動方式 の 制御機構 の効率化、( 2 ) 一 般文書理解へ の適‖1 と機能拡大、( 3 ) 文書理解 で は、( 1 ) 知 一 文書理解 システムの ユ ーザ ・イ ンタフ ェー ス開発 などを将来課題 と し、 方情報操作 のための対 能的 な情 報管理 などを将来課題 とす る 情報提示 イ ンタフェー ス、( 2 ) 機 話 イ ンタフ ェー スで は、( 1 ン が、 本研究 の成果 の 下で発展的 に解決 して い く必要 がある。 謝辞 高 柳電子科学技術振興財団 の研究助成 によ り、以上 に報告 した数 々の成果を得 ることがで きた。本研究課題 は、救吉 田雄 = _ 名古屋大学 工学部教授 が、福 村晃夫中京大学情報科学部教授 ( 名古屋大学 名誉教授) の 推薦 の下 に計画 されたが、吉 田先生の突然の逝去 によ り、吉 回先生の 研究計画 の 下 に私報告者 が引 き継 いで 、 今日に至 った。吉 田先生の意図を充分 に結実 で きた訳で はないが、 この 間引 き続 き ご支援 いただ いた貴財団 に心 よ り深謝 いた します。 また、始終 ご教示 ・ご鞭縫 いただいた福村晃夫教授 にお 礼中 し上 げます。 公表論 文 Extractlon and “ 〔1 〕T.WATANABE, Q,Lし0, M.MIZOGAMI, Y.YOSHlDA, Y. INACAKl : Automatic ledge bascd Classificatloll oF Data ltems from Library Cataloging Cards by a Kllo‖ ApproachⅢ, Proc.of MIV-89, pp.67-71(1989). ",信 学技 報, P R U 8 9 1 2 6 , p p . 1 8 〔2 1 水 谷, 岡 部, 渡 辺 , 吉 田 : “等 高線 の 自動読 み取 り (1990). 〔3 〕 早川 , 川 口. 渡 辺 , 吉 田 : “市街地地 図か らの 道路 ネ ッ トワー クの 構 成 とそれ に基づ い た道 "‐ 機能 図形情 報 システ ム ・シ ンポ ジウム論 文集, p p . 1 1 1 1 1 6 ( 1 9 9 0 ) . ",情 処 ・情 報 1 1 , 丹羽 , 渡 辺 ‐ 古 田 : “道 案 内地 図情報 システ ム にお け る略 図 と文章 の 提 示法 路情 報 の 抽 出 システ 之、 報 告202,pp.18(1990). ー 〔5 〕5 各, 渡 辺 , キ 凹‐ 稲 妊I : “田書 目録 カ ー ドを題 材 と した知 識 ベ ー ス ・アプ ロ チの 評価 に つ いて ",信 学 技 報, P R U 9 0 8 , P P . 2 5 3 2 ( 1 9 9 0 ) ` 〔6 〕丹 羽 , 吉 田, 福 村 : “道路網 の 階層 的表現 に もとづ く経路 探 索 アル ゴ リズ ム と地 図情 報 シス テ ムヘ の応 ‖l " , 情 報 処 F 理 学 会 論文詰‐ 第 3 1 巻, 第 5 号 , p p . 6 5 9 6 6 6 ( 1 9 9 0 ) . K.KAWACUCHl l “Rccognition of Roads in an Urban 〔7 , T.HAYAKAWA. T.WATAヽABE, Y.YOSHil)Aゃ A'90, pp`215-218 (1990). Map by Usillg the Topological Road Nctwork", Proc.of VⅥ じ0, T,WA′ 「 AヽABE` Y.YOSH illA, Y.AOAKI 1ヽ : “Recogllitlon or Document Structures on 〔8 , Q“Iク the Basis of Spati31 and Ccometric Rclatiollships between Document items", Proc,of MVA'90, pp.4()1-464 (1990). Ⅲ 1 9 ! 略 . 渡 辺 . 吉 口. 稲 垣 ・ 斉 味 : “知 識 ベ ー スに基 づ い た図書 目録 カ ー ドの 理 解 Ⅲl 青報 処理 学 会 論 文誌 。 第 1 1 巻。 第 1 2 号. p p . 1 7 5 5 1 7 6 7 ( 1 9 9 0 ) 。 1 1 0 , 成 r t _ H監 ‐, 金 井 、 渡辺 4 杉 江 t “帳 票 にお け る枠罫線 構造 の 記述 と認 識 ',信 学 技報, PRし 9 0 ■8 9 , p p . 3 9 1 6 ( 1 9 9 1 ) . ABE, Q.しし0, Y.YOSHlDA‐Y. 1ヽ AGAKl : hA Step、lse Recognitlon Method of 111: T,WATAヽ iッ ibrary Cataloging cards on the Basis of Varlous Kinds of Kno‖ ledge", Proc. of 10th IPCCC, pp.821-827 (1991)` -25-
© Copyright 2024 ExpyDoc