78

所
属 :情報科学研究科 知能工学専攻 データ工学研究室
職・氏名 :教授 北上 始、准教授 黒木 進、准教授 田村 慶一、助教
U R L
:http://www.de.info.hiroshima-cu.ac.jp/index.html
研究キーワード :バイオインフォマティクス・コンピューティング、
データマイニング、データベース、Web データ
森 康真
■研究テーマ
①
テーマ:配列(系列)データマイニングの研究
概要:情報科学、生物学、化学、物理学、統計学などが複合的に絡むバイオインフォマティクス
分野では、解読されたゲノムの全塩基配列やアミノ酸配列をはじめとして、蛋白質立体構造のバ
ックボーン座標配列などに対する配列解析と、遺伝子から細胞や個体を再構築できるかという生
命システム再構築が主な研究テーマです。配列データマイニング技術を基軸に、様々な形式の頻
出パターンを高速に抽出する方法や高速曖昧検索の方法などについて研究開発を行っています。
②
テーマ:配列データの索引の研究
概要:テーマ①で挙げた配列データマイニングを高速化するためには、類似する構造を持つ配列
データを高速に列挙することが大切です。我々は類似した構造を持つ配列データをクラスタリン
グすることによって類似配列検索を高速化するための索引について研究開発を行っています。
■研究テーマの応用例
①については、生物情報科学分野のデータだけではなく、電子メールや公文書のようなテキス
ト情報、図書館の貸出記録データ、病気の症例データ、空間データなどから規則性を見つけ出す
のを支援するソフトウェアツールとしての応用が考えられます。また、株価の成長パターンが類
似しているデータや病気の進行特性が類似しているデータなどから規則性を見つけ出す技術とし
ても利用される可能性があります。②についても生物情報科学分野のデータだけではなく、人間
の行動履歴分析など、位置情報サービスへの応用が考えられます。
■主な著書、発表論文
・Y. Takahashi, S. Kuroki, K. Tamura, and H. Kitakami: A Method for Constructing Disk-based
Indexes for 3-D Protein Structure Databases, Proc. IKE’09, pp.658-662, 2009.
・ Y. Takahashi, S. Kuroki, K. Tamura, and H. Kitakami: Index-based Similar
Substructure Searching Using RMSD in Protein Structure Databases, Proc. IKE'10,
Vol.Ⅱ , pp.431-437, 2010.
・ K. Miyahara, H. Kitakami, Y. Takahashi, K. Tamura, and S. Kuroki: Mining Minimum
Generalized Set Based on Multiple Alignments from Mismatch Cluster, Proc. BIOCOMP’10,
Vol.I, pp.35-41, 2010.
・高橋誉文, 田村慶一, 黒木進, 北上始: 幾何学的なサフィックス木による高速類似構造検索手
法, 情報処理学会論文誌 データベース, Vol.3 No.5, pp.62-70, 2013.
■想定される連携先
・情報関連企業、地方自治体、公的研究機関
- 78 -
所
属 :情報科学研究科 知能工学専攻 データ工学研究室
職・氏名 :教授 北上 始、准教授 田村 慶一、准教授 黒木 進、助教 森 康真
U R L
:http://www.de.info.hiroshima-cu.ac.jp/index.html
研究キーワード :データマイニング、データベース、Web データ、知識ベース、
情報視覚化
■研究テーマ
①
テーマ:時系列ブログデータからの知識発見の研究
概要:Web に基づくデータからの知識を発見することが目的である Web マイニングは、Web 構造マ
イニング、Web コンテンツマイニング、Web 利用マイニングに大別されます。我々は、Web 構造マ
イニングに着目し、時間ともに変化するブログデータから数カ月に渡って頻出するコミュニティ
であると同時に重なりを許すコミュニティを発見する技術について研究を行っています。
②
テーマ:大量の知識の整理と見える化の研究
概要:インターネットの検索やデータマイニングによって得られた大量の知識は、整理・分類し
互いに関連付けされてはじめて価値を持ちます。ユーザが知識の整理・分類し、関連付けるのを
支援するため、我々は視覚化インタフェースを開発しています。
③
テーマ:マイニングされた知識の利活用の研究
概要:データマイニングで得た知識に基づいて、未来を予測する手法を研究しています。台風な
ど科学の法則に従って起こる現象に関するデータセットをマイニングして、あるイベントが観察
されたらその後何が起こりそうであるかをシミュレーションする方法を研究しています。
■研究テーマの応用例
大量かつ様々な形式のデータを利用あるいは解析しようとする立場の人に対して、人間の発想
を支援するツールとして利用可能です。①については、時間的に変化する Web 空間における共同
体や規則性の発見ツールとしての応用可能性があります。②については、ネットワークで表現さ
れた知識の体系を閲覧・分析するのに役立ちます。③については防災やマーケッティングへの応
用が考えられます。
■主な著書、発表論文
・高木允, 田村慶一, 森康真, 北上始: 密な部分構造抽出のための階層的凝集型クラスタリング
手法, 日本データベース学会論文誌, Vol.7 No.1, pp.275-280, 2008.
・岡本潤一, 森康真, 黒木進, 北上始: 異種系統樹間の調停作業支援のための球面描画法, 電子情
報通信学会第 21 回データ工学ワークショップ, 2010.
・中村翔, 森康真, 北上始: 階層的クラスタリングを用いた台風被害予測モデルの構築, 第 62 回
電気・情報関連学会中国支部連合大会, 2011.
■想定される連携先
・情報関連企業、地方自治体、公的研究機関
- 79 -
所
属 :情報科学研究科 知能工学専攻 データ工学研究室
職・氏名 :教授 北上 始、准教授 黒木 進、准教授 田村 慶一、助教
U R L
:http://www.de.info.hiroshima-cu.ac.jp/index.html
研究キーワード :時空間データベース、マルチメディアデータベース
森 康真
■研究テーマ
①
テーマ:時空間データベースの研究
概要:位置や時刻により参照されるデータ(時空間データ)を記憶するデータベースを時空間デー
タベースと呼びます。時空間データベースについて、(1)索引とそれを用いた検索法、(2)検索結
果の視覚化、(3)時空間データの分析について研究しています。3 次元データから高次元データま
で、データの次元に応じてふさわしい検索と視覚化のアルゴリズムを研究しています。
②
テーマ:マルチメディアデータベースの研究
概要:テキストデータベース、ビデオデータベース、画像データベース、音楽データベースを対
象として、(1)コンテンツの意味の抽出、(2)抽出された意味に基づく分類、(3)意味に基づく検索、
(4)検索結果の編集と表示について研究しています。
■研究テーマの応用例
テーマ①の応用例としては、空間マイニングがあります。これはデータの分布を分析して、そ
の特徴を見つける技術であり、地域分析や商圏分析に利用することができます。また、時間の経
過に伴う変化を分析することにより、変化の類似性による分類に役立てることができます。また、
過去のデータとの類似性を調べることにより、将来の予測を行う上での手がかりにできます。
テーマ②の応用例としては、マルチメディアコンテンツの類似検索や要約があります。たとえ
ば、大量のビデオや音楽から重要なところだけを抜き出して視聴することに役立てることができ
ます。また、マルチメディアコンテンツの意味の類似性を手がかりとして、複数の情報源から提
供されるマルチメディアコンテンツを横断的に分類、統合することや、マッシュアップサイトを
構築することにも役立ちます。
■主な著書、発表論文
・浮田健太, 黒木進, 森康真, 北上始: 空間オブジェクト集合からの頻出近接属性パターンの高速
抽出法, 電子情報通信学会第 19 回データ工学ワークショップ, 2008.
・平和幸, 黒木進, 北上始, 森康真: 時系列データベースからの知識発見における次元圧縮の評価
に関する検討, データ工学と情報マネジメントに関するフォーラム DEIM2010, 2010.
■主な特許、芸術作品等
・桜のデータベース(上記 URL からアクセスできます)
■想定される連携先
情報関連企業、地方自治体、公的研究機関
- 80 -
所
属 :情報科学研究科 知能工学専攻 データ工学研究室
職・氏名 :教授 北上 始、准教授 田村 慶一、准教授 黒木 進、助教 森 康真
U R L
:http://www.de.info.hiroshima-cu.ac.jp/index.html
研究キーワード :グリッド、マルチコア、自律制御機能、動的負荷分散、
並列分散処理
■研究テーマ
①
テーマ:生物指向コンピューティング環境における制約処理の研究
概要:コンピューター資源が動的に変化する環境において、様々な制約問題を効果的に解く方法
について研究を行っています。また、制約処理過程における状態変化をビジュアルに表示する方
法やグラフィカルなユーザインタフェースについても研究を行っています。
②
テーマ:並列計算機環境における制約処理の研究
概要:マルチコア、計算機クラスタやグリッドなどの様々な並列計算機環境において、制約問題
を効率的に解く方法について研究を行っています。特に、(1)マルチコア上で制約問題を効率的
に解くための並列分散化手法、(2)索引構造を計算機クラスタ上で高速に構築する方法や索引構
造を利用した制約処理の高速化、(3)様々な並列計算機環境において制約問題を解く過程で発生
する負荷の偏りを効率的に解決するための動的負荷分散処理について研究を行っています。
■研究テーマの応用例
①については、ビジネスグリッドの自律制御機能として応用可能です。②については、コンピ
ューティンググリッドに応用可能であり、特に、探索問題を含む混合整数計画法やデータマイニ
ングなどを高速に処理する方法として利用可能です。
■主な著書、発表論文
・澤田祐介, 田村慶一, 荒木康太郎, 高木允, 北上始: PC クラスタ上でのディスクベースサフィ
ックス木の並列構築方式, 電子情報通信学会第 19 回データ工学ワークショップ, 2008.
・M. Takaki, K. Tamura, T. Sutou, and H. Kitakami: A New Load Balancing Technique for Parallel
Modified PrefixSpan with Distributed Worker Paradigm and Its Performance Evaluation, Proc.
6th Int. Symp. High Performance Computing (ISHPC-VI), LNCS Vol.4759, pp.227-237, 2008.
・S. Yagi, K. Tamura, and H. Kitakami: Parallel Processing for Stepwise Generalization Method
on Multi-Core PC Cluster, International Journal of Knowledge and Web Intelligence (IJKWI),
Inderscience Publishers,Vol.3 No.2, pp.88-109,2012.
・K. Hirahara, K. Tamura, H. Kitakami, and Shingo Tamura: Parallel Processing of Burst
Detection in Large-Scale Document Streams, GSTF JoC,Vol.2, No.4, 7pages,2013.
・Y. Watanuki, K. Tamura, H. Kitakami, and Y. Takahashi: Multiple Buffering for Parallel
Approximate Sequence Matching using Disk-based Suffix Tree on Multi-core CPU, GSTF Journal
on Computing (JoC), Vol.3 No.3, pp.51-57, 2014.
■想定される連携先
・地方自治体、公的研究機関
- 81 -
所
属 :情報科学研究科 知能工学専攻 データ工学研究室
職・氏名 :教授 北上 始、准教授 黒木 進、准教授 田村 慶一、助教 森 康真
U R L
:http://www.de.info.hiroshima-cu.ac.jp/index.html
研究キーワード :学習、予測、最適化、クラスタリング、乱択アルゴリズム
■研究テーマ
①
テーマ:学習アルゴリズムの研究
概要:既知のデータから未知のデータに対する予測する方法を研究しています。具体的にはテキ
ストデータ(日本語、英語)、Web データ、分子配列データを対象に、教師付き学習を用いて分類
する方法を研究しています。特に、サポートベクターマシンに注目しています。
②
テーマ:クラスタリングの研究
概要:大規模なデータを理解するために、画像やテキストのデータを教師なし階層的クラスタリ
ングアルゴリズムにより分類する方法を研究しています。また、Web やソーシャルネットワーク、
生物ネットワークのデータに対してクラスタリングアルゴリズムを適用し、コミュニティや有用
な生物機能を見つけ出す方法を研究しています。
③
テーマ:乱択アルゴリズムの研究
概要:学習や分類を行うとき、最適化計算を行う場合が多い。よって、学習や分類を高速に実行
するためには最適化計算を高速化する必要があります。本研究では、ギブスサンプリングを始め
とする乱択アルゴリズムの最適化計算への応用について研究しています。
■研究テーマの応用例
大量に集まったデータの分類の応用例としては、インターネット上のテキストデータの分類が
あります。オリジナルのテキストに類似したものとそうでないものを分類することにより、オリ
ジナルとコピーの分類に役立てることができます。また、マルチメディアコンテンツの検索結果
のわかりやすい表示に利用できます。
■主な著書、発表論文
・加藤智之, 森康真, 荒木康太郎, 黒木進, 北上始: 可変長配列パターン抽出法におけるギブス
サンプリングを用いた不要パターンの除去方式, 日本データベース学会論文誌, Vol.6 No.1,
pp.65-68, 2008.
・河野修久, 加藤智之, 田村慶一, 北上始: 配列データベースから類似部分配列を抽出するため
の GS 最適化手法に関する考察, 電子情報通信学会第 19 回データ工学ワークショップ, 2008.
・N. Kono, H. Kitakami, K. Tamura, and Y. Mori: Extracting Similar Subsequences by Gibbs
Sampling with Distributed MGG, Proc. PDPTA’09, pp.669-675, 2009.
・中田章宏, 田村慶一, 北上始, 高橋誉文: CMO 問題に対する改良版 EO を用いた発見的解法, 情
報処理学会論文誌 数理モデル化と応用, Vol.6 No.3, pp.87-99, 2013.
■想定される連携先
情報関連企業、地方自治体、公的研究機関
- 82 -