日本語によるバイオ情報ポータルサイトの 開発 バイオ

日本語によるバイオ情報ポータルサイトの開発
各研究開発項目の紹介
【情報研】藤山秋佐夫、武田英明、北本朝展、川本祥子、水田洋子、出宮スウェンミノル、小林悟志、ムリアディ・ヘンドリ、鈴木聡、塚本ゆみ、許山肖子、久木田加津子
【遺伝研・DDBJ】菅原秀明、五條堀孝、阿部貴志
【東京理科大学】宮崎智
【㈱三菱総合研究所】荒木次郎、伊藤武彦、白井康之、近藤隆、市吉伸幸
●バイオポータル・ウェブサイトの公開
以上の技術や研究のもと、2004年11月にウェブサイトを公開しました。
●雑誌の評価(IF)や文献引用情報を利用した、生命科学文献
(NCBI・PubMed)の日本語による検索
主な開発、作製項目
用語辞書
バイオコラム
遺伝子百科
生命科学文献検索
日本語ユーザインターフェース
バイオインフォ道具箱
–Webサービス
–バイオメタデータベース
–ゲノムメニュー
日本語版Ensembl
マウスをかざすと
日本語訳を表示
日本語で検索語
を入力
著名な論文、重要な論文が
検索結果の上位に
●日本語ゲノムブラウザ - 和サンブル
MediaWikiによるオントロジ構築支援
RNA(Semblog)によるニュースサイト
リンク集等
•Ensembl(アンサンブル)は Sanger Institute と EBI (European Bioinformatics Institute)
の共同開発による、ゲノムブラウザー、ゲノムアノテーション閲覧システムのことです。
和サンブルはEnsemblを元に日本語で開発されています。ゲノムの検索にはEnsMart
(アンスマート)の起動によってヒトゲノム中にある特定のアミノ酸を持つ遺伝子のリスト
アップが可能です。さらに遺伝子の上流配列を抽出することも可能です。
●幅広い生命科学研究者支援 - バイオインフォマティクス道具箱
(遺伝学研究所、DDBJ、東京理科大学)
 これからバイオインフォマティクス初心者から上級者まで対象にしています。
 「どんなデータを利用できるのか?」、「どんな解析サービスがどこにあるの?」、「どのように解析ツールを使えばい
いの?」といった疑問を解決できます。
遺伝子情報:
遺伝子の数
(1) ゲノムメニュー
生物種を選ぶ
バイオインフォマティクス解析に必要となる様々な生物種ごとにゲノム情報をまとめたものです。ヒトやチンパンジーな
ど解読されたゲノムを網羅しています。生物種は、和名・学名の両方で検索できます。
詳細情報
(2)Webサービス
インターネット上で公開されているデータベースと解析ツールを自由に組み合わせて、利用者が目的に応じた新しい解析ツール
を簡単に作成するための素材となるサービス(Webサービス)を開発・提供しています。
Webサービスとは
ヒト遺伝子の相同性検索ワークフロー
・一般的にHTTP上で動作し、RPCやXMLでのメッセージ交換を実現する技術。
・ システム連携をする上で、相互接続性が優れている技術。
(Simple Object Access Protocol (SOAP)を適用したものと定義する)

プログラムがDirectoryを参照して必要なデータ資源を発見する
プログラムが発見したWebサービスを利用して結果を取得する

プログラムが取得した結果を手元のデータシステムに格納する
手元のデータシステムでの処理を行う。
Directory service
(UDDI, ebXML)
Search
Service request
Web services
providers
Web
services
We services providers
providers
Web services
providers
●Semantic MediaWikiによるオントロジ構築支援
•バイオポータルプロジェクトでは,利用者が用語辞書を利用して知らない用語の意味を調べたり,オン
トロジーをブラウジングすることで関連用語を調べることができるSemantic Web環境の提供を目指して
いる.このような環境をつくるためには,オントロジー言語(RDF, RDFS,OWL)でオントロジーを構築する
ことのできるツールを用意する必要がある
解析ワークフロー(■: 解析に使用するWebサービス)
Refseq
Bind
Bind
In-house data
system
Publish
目的

ヒトゲノム遺伝子をデータベース内から探索し、他の生物種の
類似遺伝子探索を行い、遺伝子の機能、ならびに進化的な由
来を推定する。
ワークフロー構築手順の概要

Refseqによるヒト遺伝子の探索

BLASTXによる相同性検索

相同性検索結果からのベストヒットだった遺伝子の機能・生物
種の抽出
各生物
染色体をクリック
ヒト遺伝子配列
(アミノ酸)抽出
Blastp
出力結果
Work flow
described by
WSFL/XLANG
Ensembl
Stein, L. (2002) Creating a bioinformatics nation, Nature, 417, 119-120
バイオの分野では、解析ツールやDBを統合的に使用するのが一般的。
Web サービスを活用することによって、アクセス方法を標準化し、
さまざまな組み合わせの実現を容易にすることが可能。
例えば、Ensemblに登録されているヒト遺伝子名でマウスと同
じ遺伝子名と同じ遺伝子だけを抽出するといった場合、
「Ensembl」メソッドを追加するすれば抽出することが可能
(3) バイオメタデータベースの構築と公開
インターネット上の生物学的データベースの構造とアクセス時のCGIを解析し、利用可能なデータベースとアクセス手
法の組み合わせを網羅的にデータベース化し公開している。このメタ情報自身をウェッブサービス化することで、研究
者の目的に応じた研究用データを自動的に探索し、取得する仕組みの研究開発へ拡張している。2005年5月現在
の蓄積レコード数は、17,163件に達している。
・領域専門家が自分で編集可能なツールの必要性
今まで多くのオントロジー構築支援ツールが提案されている.しかしながら,多くのツールは領域専
門家が自分で簡単に編集可能なツールではない.このような問題を解決することを真剣に考える必要
がある.本研究では,Wikiを拡張し,極めて使いやすいオントロジー構築支援ツールを提案する.
・Semantic Wiki
・Wikiの利点:
・即座にページが作れる.
・ページ間の関係も作れる.
・CMS(Content Management System)である.
・Wikiでラベルつきリンクが書けるように拡張.
・手軽にRDF(Resource Description Framework)
相当の情報を書き込み,管理することができる.
•RDF Triple:
source_page property target_page
ラベルつきリンクはsource_pageのページの中
で, ->property ->target_page と表現される.
レコードの固
有番号
DDBJやNCBIな
ど、データベー
ス提供期間の名
称
公開されている
DBの名称
下記の分類を記述
Complete:マニュアルによる
基本情報の査定終了
Finish:査定作業終了
Reviewing:査定中
Exception:CGIの自動解析は
できない。
Access denied:ロボットによる
アクセスは否定されるもの。
ホームページのURLと条件設定のURLはそれぞれのオリジナ
ルサイトへのリンクになっています。画面左下の「検索・解析
サービス利用のためのURL解析」ボタンをクリックすると、この
データベースを利用するための条件設定のページ上で使われ
ているHTMLのタグがオリジナルのページとともに別ウィンドウ
で閲覧できます(次図)。
Fig.1: Semantic Media Wikiの編集例.
•ラベルつきリンクを表示するためのWiki Syntax:
[[term:target_page|property]]
http://www.bioportal.jp
Fig.2: source_pageの表示例.
abion
日本語バイオポータルサイト