XMLを用いた情報システム

XMLを用いた情報システム
データの互換、Webとの連携
概要






XMLとは?
XMLの具体例:住所録の作成
XML誕生まで
様々なXML
XMLのこれから
まとめ
XMLとは?

eXtensible Markup Language




Extensible = 拡張可能な
Markup = マーク付け
Language = 言語
情報の構造と意味を記述できる言語
XMLとは?



文書に「構造」を持たせる
文書に「意味」を持たせる
文書に「機能」を埋め込む
この抽象性がeXtensibleたる由縁
XMLの例:住所録


住所録を作成する
含まれる情報





氏名
フリガナ
年齢
電話番号
住所
氏名:於保 俊
フリガナ:オホ スグル
年齢:21
電話番号:090-0000
住所:愛知県名古屋市・・・
Excelによる住所録作成


Excelを起動して各列
に情報を書き込む
出来上がった住所録
をExcel形式で保存
Excelによる住所録作成



Excelで保存したデー
タをメモ帳(テキストエ
ディタ)で閲覧
全く読み取れない文
字列が出現
データを他のソフトな
どで活用できない、と
いうことを意味する
別の形式ではどうだろう?



訳のわからない文字の羅列になったのは
特殊なExcel専用の保存形式のせい
データをバイナリ(数字の羅列)として記憶
するから
テキスト(文字だけの形式)で保存したらど
うか?
テキストとバイナリ

テキストファイル



文字データだけで構成されたファイル
数多くのコンピュータで共通して利用できる
バイナリファイル


専用のアプリケーションで扱うことを前提とし
て作成されたファイル
それぞれ固有の制御コードを含む
CSVという保存形式




Comma Separated Values
「,」で各データを区切って保存する
昔から使われてきたデータ保存の形式
テキスト形式である
CSVでの住所録保管

CSV形式で保存する


ExcelはCSVでの保存
機能を持っている
メモ帳で閲覧可能
CSVの欠点

データを構造化できない


データの意味付けが弱い


電話番号を複数持つ人間がいたら?
幾つかの異なる意味付けの方法が存在
データ自体の情報を記述できない

このデータの文字コード(言語)は?
XMLにしてみよう!


XMLを使って、同様の住所録を作成します
含まれる情報は、





名前
フリガナ
年齢
電話番号
住所
XMLのタグを定義する


タグとは、XML文章の構造を記述するもの
タグは「<」と「>」で囲まれた文字列





名前 → <名前>
フリガナ → <フリガナ>
年齢 → <年齢>
電話番号 → <電話番号>
住所 → <住所>
XMLにした住所録
<住所録>
<カード>
<名前>於保 俊</名前>
<フリガナ>オホ スグル</フリガナ>
<年齢>21</年齢>
<電話番号>090-0000-xxxx</電話番号>
<住所>愛知県名古屋市・・・</住所>
</カード>
</住所録>
XMLの利点




階層化されたデータの保持ができる
データの互換性、汎用性が高い
データを処理するソフトがデータの持つ意
味を知ることができる
異なる定義のXMLや、異なる形式のファイ
ルへの変換が可能になる
XML誕生まで

SGML


HTML



難解な言語仕様のため普及せず
Webの成長と共に普及
しかし、機能が限られている
そしてXML誕生
SGML




1986年に国際規格として制定
XML/HTMLのもとになる
タグの定義機能
意味・構造の記述
SGML成功事例



Oxford English Dictionary 第2版
マグロウヒル科学技術辞典
EC(ヨーロッパ共同体)出版局
SGMLはなぜ普及しなかった
か?




タグの過剰な省略機能
過剰なカスタマイズ機能
意味のサポートの欠如
体系の中での位置付けの欠如


仕様が複雑になり分かりにくい
複数組織間の連携がうまくいかない
HTML



Hyper Text Markup Language
1989年、ヨーロッパ核物理学研究所CERN
でWWWプロジェクトの一部として開発
Webでの文書の記述用
HTMLを見るには


ブラウザでWebペー
ジを表示し、「ソース
の表示」を選択
世界中のWebページ
はHTMLで記述されて
いる
HTMLの限界

予め定められたタグしか使えない



表現力に乏しい
Webに関わる企業がそれぞれ独自の拡張
曖昧な構造記述


意味を持たせにくい
解釈系によって異なる解釈を行ってしまう
XML登場




1998年2月にW3Cによって策定される
SGMLの無駄な機能を削ぎ落とす
HTMLと同等の感覚で扱えるように
他のマークアップ言語の骨組みとして使用
されるようになる
様々なXML

XMLを骨組みとした様々な言語が誕生





XHTML
MathML
SVG
MusicML
MML
XHTML


HTMLをXMLに適合するように 再定義
Webページを記述

文書構造の記述に特化



HTMLで記述していた見栄え(ページの色や文字
のサイズ)に関する記述を除去
HTMLより厳格な記述法
HTMLと同様に扱うことも可能
MathML



数式を記述するXML
数式の表記(見え方)と数式の意味を記述
するタグを備える
XHTMLとの連携を強く意識した設計


Webページに数式を掲載できるようになる
検索エンジンから数式の検索が可能に
MathML
SVG




2Dベクター画像を記述するXML
Scalable Vector Graphics
他のXML文書に埋め込んで使用
XHTMLとの連携を意識した設計

Adobe社から提供されるSVGプラグインを使用
すれば、WebブラウザからSVGの閲覧が可能
SVG
MusicML


楽譜を記述するXML
自動演奏


ソフトウェアが楽譜の意味を知ることができる
楽譜データベース

フレーズから曲名を検索可能
MML




診療データを記述するXML
Medical Markup Language
1995年、日本医療情報学会電子カルテ
研究会年次総会で提唱されたSGMLによる
交換フォーマットが起源
異なる診療機関間のデータ交換が目的
MML
XMLのこれから



MicrosoftOfficeがXML対応
WebブラウザのXML対応
XMLを用いた基幹システム開発
MicrosoftOfficeがXML対応


Webやその他のアプリケーションとの連携
強化
WordやExcelのファイルから必要なデータ
を自動的に抽出、利用可能に
補記:2002年12月段階では、肝心のXML
スキーマが公開されていない。
WebブラウザのXML対応

対応ブラウザ


InternetExplorer
NetscapeNavigator
XMLを用いた基幹システム開発

基幹システム開発ツールがXML対応



J2EE
.net
ブラウザやアプリケーションとの連携強化

あらゆる情報をXMLで一元的に管理
まとめ

XMLとは?



eXtensible Markup Language
拡張可能なマーク付け言語
XMLの具体例:住所録の作成


Excel、CSVでの保管例
XMLでの保管例(タグの定義)
まとめ

XML誕生まで


様々なXML


SGML、HTML、そしてXMLへ
XHTML、MathML、SVG、MusicML、MML
XMLのこれから

MSOffice、Webブラウザ、等多様なソフト、シ
ステムの共通言語へ