ppt file - 地球惑星科学科

なぜ情報実験か?その1
Unix (Linux) / Internet の歴史と
学問の情報化への展開を踏まえて
北海道大学理学研究科
地球惑星科学専攻
林 祥介
[email protected]
2005年10月07日
目次
• 情報実験では
科学の情報化
ご近所の活動
• 電子計算機から情報環境への発展
特に, Unix, Internet, X
フリーウェア, オープン開発な文化
計算機のダウンサイジングと Internet 爆発
• 計算機科学・情報科学
V.Bush1945
計算機に知識を教えること
情報実験では
情報化時代の科学とは
• 科学者
– 新たな知見を見出す人
– 情報を作る人
– 一次生産者
• 情報化時代の科学(V.Bush1945)
– 細分化専門化,情報の爆発
– 情報の流通,加工,掌握が科学においても大きな役割
• 「先進国」の要件
– 情報の掌握
– 情報利用者だけの国は先進国から脱落
– グローバリゼーションの恐怖
地球惑星科学での展開
• 現在まさに研究開発中のさまざまな活動
– ネットワーク透過なデータ構造とユーティリティーの設計
• http://www.unidata.ucar.edu/
– スーパーコンピューティング, GRIDコンピューティング
• 大規模シミュレーション・データ解析のためのネットワーク透過な並列計
算・並列データ処理
– 遠隔計算・遠隔観測
• 観測装置(望遠鏡など)の制御と観測
• データの分散統合的利用
– 観測データを使った数値計算
• 分散型リアルタイム気象データアーカイブ
– データをネットワーク上に分散させたままあたかもひとつのデータセットして
利用可能にする
– 例:米国で研究教育用の道具として開発中のTHREDDS
– 知見情報アーカイブ
• 計算機に知識をおしえること
情報実験では
• 計算情報環境の技術的基本概念を構成している
– Unix (Linux)
– Internet
– X window system
をひもとき,自分の情報環境は自分で維持できるようになる.
• 自分がおかれている情報環境の総体に思いをはせる
– ネットワーク社会人(常識や作法を知る)
– 安全性,安定性への理解
• 地球惑星科学の情報化へ貢献できる人材が生まれれるきっ
かけになれば幸い
– 情報利用者から,情報提供者へ,そして,科学の情報インフラのデ
ザイナーへ
ご近所での展開
• 遠隔計算・遠隔観測のためのネットワーク環境の構築
– 環境研究所, 天文台, 宇宙研のスーパーコンピュータの利用
– データセンターとの通信
• Gbit大域のネットワークの設計と接続, 制御を自前で行う必要
• Super SINET
• JGN(Gbit接続実験)
• 各種サーバーの運営
– 情報発信環境の維持と情報提供の試み
• 地球惑星科学専攻サーバ
• 地球流体電脳倶楽部
ご近所での展開
北海道仮想天文台プロジェクト
• http://madeira.cc.hokudai.ac.jp/ops/nw-key-men/index.php?snobs
ご近所での展開
計算機に地球惑星科学の知識を教えていくこと
• ネットワーク上での知識提供実験 / ネットワーク上での教育
実験
– 参考: School of Internet (WIDE) (http://www.soi.wide.ad.jp/)
– 地球惑星業界でも同様な試みを展開する必要
• WIDE SOI にならった我々の活動
Mosir プロジェクト (http://www.ep.sci.hokudai.ac.jp/~mosir/ )
• データの構造化, 知見プラットフォームへの試み
– 地球流体電脳倶楽部 (http://www.gfd-dennou.org/)
•
•
•
•
地球惑星(流体現象)にかかわる諸々の知見をネットワーク上にためる
そのための道具作りをおこなう
情報交換に便利な数値データ構造の考察
地球惑星科学における知見データの構造自体を考える
電子計算機から
情報環境への発展
電子計算機の黎明
• 1930’ 計算(機械)の原理(アルゴリズム)
Gödel (1931): 不完全性定理
Turing (1936) : TM (Turing Machine)
• (配線型)電子計算機
ABC (Atanasoff Berry Computer, Atanasoff & Berry,
1939)
ENIAC(Electronic Numerical Integrator And
Calculator, Eckert & Mauchly, 1946)
弾道計算, 気象計算(順圧非発散二次元渦度方程式)
• ノイマン型(プログラム内蔵型)計算機
EDVAC (Eckert , Mauchly, Neumann),Neumann 1946
EDSAC (Wilkes, 1949) 世界初のノイマン型計算機(英)
電子計算機の黎明
ENIAC(1950.4.4)
Namias
Wexler
Frankel
Von Neumann
Fjortoft
Charney
Freeman Reichelderfer
UCSD ECPC(Experimental Climate Prediction Center) 写真集より http://ecpc.ucsd.edu/general/pics/eniac-50.html
計算機としての計算機
1950’ 計算機らしい(?)
計算機
• IBM701(1952)
汎用大型計算機(Mainframe)
研究(軍事)機器から
実用的な機器へ IBM701
http://www-1.ibm.com/ibm/history/exhibits/701/701_141512.html
気象庁最初の数値予報?計算機IBM704, 1959
• OS= Operating System(基本ソフト)
計算作業の順番待ちを自動化するソフトウェアとしてはじまる
バッチシステム(batch systems)
• I/O(Input/Output)の標準化
デバイスドライバー(device driver)
計算機としての計算機
1950’ 高級プログラム言語の登場
コンパイラ(compiler)によって機械語に翻訳する
FORTRAN:数値計算
(FORmula TRANslator System,
J. Backus, IBM, 1954)
COBOL:事務処理(帳票)計算
(COmmon Business Oriented Language,
The Conference on Data System Languages
(CODASYL), 1959)
計算機は計算のための道具として普及しはじめる
計算しない計算機
文字処理
• Unix :1969 年に発明され開発が始まったOS.
骨子は, 計算する機械に文字(アルファベット)
処理させること.
– プログラム(=文字列)開発環境
– プログラムのドキュメンテーション(解説文章作成)環境
– IBM 大型計算機は数値処理のみを念頭に設計,文字処理
は苦手.
• 1byte(=8bit)単位の処理 vs. 1word(=4byte)単位の処理
• 文字処理を得意とするプログラミング言語 C
Unixの普及(1)情報科学業界
Unix は先端的な情報科学研究用環境として普及発展
• 情報科学研究者(開発者)フレンドリー
– 米国電信電話会社(AT&T) の Bell 研で作られたのが,売りもんじゃなかった.
• 開発者身内用のプログラミング環境
– ソースコードがただで公開, 配布されることも許容していた.
– 自分に都合よく改編可能.
– 米国の情報科学科でソースコードが教科書として 利用され広まる.
• 開発の幸せなフィードバック=使う人が作る人 (/usr)
お互いに資源を出し合い, 使いあい, 修正改良しあう
– たくさんの人が使うのでどんどん鍛えられる
– 便利になるので使う人が増え, 作る人も増える
–
• Internet, Linux へ続くフリーウェア文化, オープン開発文化
Unixの普及(2)一般研究業界
(計算機を使う)一般科学者の研究用環境として普及
• プログラム開発環境+ドキュメント処理機能→便利.
–
–
–
–
ソフトウェアが作りやすい,
計算ができる(そもそも計算機),
マニュアル作成ユーティリティーを使えば文章(論文)が清書でき,
その整理(情報処理)ができる.
計算機から情報処理環境(パソコンがない時代の文房具)へ
(ただし英語だけ)
• 科学技術用計算機が Unix を OS とするようになったルーツ
• 米国の大学では1970’ 後半にはUnixが普及
• 科学諸分野と情報科学分野との交流する土台
– 情報科学が目指していることが他分野にも流れ出しそれぞれの分野での情報
化を促す
– 今日の科学の情報化に結びつく基盤,グローバリゼーションの土台
Unixの普及(3)軍
米国の諸々の活動のスポンサーは軍
ソースコードが公開されていることは軍にとっても望ましい.
特定の企業に国防「情報」が支配されるのは喜ばしくない
国防総省 ARPA (Advanced Research Projects Agency,
今の DARPA) 核戦略・防衛兵器のための基礎研究を推進
大学が研究中心
特定の企業に情報基盤を支配されたくないので大学に委託.
結果として軍がオープン開発を支援
カリフォルニア大学バークレー校 (UCB)→BSDUnix, Free BSD
MIT, CMU, SU, …
70年代から80年代にUnixは大学で大きく発展,
1980年代後半には研究環境といえばUnix
通信する計算機:Internetの黎明
ARPAnet
• 1960’s終りから核戦争を想定した防衛システム基礎研究とし
てARPAが行うパケット通信計算機接続の研究
• 中心のないシステム, 分散統合システム
どこのホストコンピュータが核攻撃によって 蒸発しても
どこかのコンピュータが生き残り,
ネットワーク全体としては機能が維持される
• ARPAnetの研究中心:例によって全米の主要大学
– スタンフォード大学 (SUN = Stanford University Network)
– カリフォルニア大学バークレー校
• TCP/IP
Transmission Control Protocol / Internet Protocol
Internetの黎明(2)
ARPAnetとTCP/IPとUnix (1980)
• 国防総省 ARPA が OSとしてバークレー版Unix (BSD Unix)
を採用
→ Unix と ARPAnet の諸々の技術が結合
TCP/IP が事実上の標準に
• 1980 年, バークレー版 Unix (BSD Unix) が TCP/IP を実装,
TCP/IPはUnixをOSにしている機器に一挙に広まる
• Unixは米国の研究高等教育機関現場にすでにある程度ひろまって
いたので, TCP/IPは米国研究教育業界での通信プロトコルの事実
上の標準 (Defuct Standard)となった
Internetへ
• internet (小文字):
– 複数の network を相互につないだもの (米国では高速道路網を
interstate という, そのもじり).
– そのうちで特に TCP/IP でつながれたネットワークの集まり, メタネット
ワークのことをいう.
– TCP/IP 接続の特色はこのメタネットワークがあたかも一つのネットワー
クのごとく利用者からは見えるところにある.
– 複数のネットワークが接続されてできていることを全く意識しないで良い.
• Internet (大文字):
– TCP/IP で接続されたネットワークのうちの, ARPAnet をルーツに持つ
ネットワークのことをいう.
– Internet とは国際的な共同運営団体に加盟し, 整合性を保ったアドレ
ス管理, 経路制御などの運営をしているものたちである.
絵を描く計算機:X
(アルファベットからの脱却)
ビットマップ(bitmap)ディスプレーの登場とX
• ビットマップディスプレー: 文字と絵を同時にあつかえるディス
プレー
– それまでは:
• 英数字のみをあつかうキャラクターディスプレーと絵のみをあつかう
グラフィックディスプレーを別個に持たねばならなかった.
– でもハードウェアがあっただけではそれだけじゃ制御が難し
い →X
• MIT:産官学共同研究開発の中心 (MIT X コンソーシアム)
• ワークステーション
– 三種の神器 BSDUnix+TCP/IP+X を備えた, 汎用大型計
算機に対する机上サイズの小型計算機のこと
X window system(2)
Xは何が偉い
• 規格化(標準化)とサーバー・クライアント
– 個々の命令セットが体系化され標準規約化
– ディスプレー, マウス, キーボード, スピーカーなどの人間機
械インターフェースを支配するサーバ
– 文字の表示, 絵の表示, 音の発生等々は個々のソフトウェ
ア(クライアント)が担当する
X window system(3)
Xは何が偉いか(2)
• ネットワーク透過(network transparent)
– Internet技術と結合
• internet という通信手段と結合することにより遠方の資源を仮想資
源としてあたかも手もとの計算機に付随する資源のごとく利用.
• ウインドウを飛ばす: 遠方の計算機が出力する画像を手元の計算
機のディスプレー上に表示.
X window system(4)
Xは何が偉いか(3)
• 日本語が表示できるようになった
→やっと日本の一般研究者にもUnixが
– ただし, すでに日本語入出力技術は日本でも進んでいたか
ら, すみやかな導入が可能だった
• 日本語ワープロ(1981)
– ようやく日本でも計算機から情報処理環境(文房具)へ
• それまでは文字処理(ワープロ)と数値処理(汎用大型計算機)とは
まったくの別物として扱わなければならなかった
計算機の普及と文房具化
ダウンサイジング第一期
1980 年代後半~1990 年代前半: ワークステーション
• ハードウェアの進歩, 普及と低価格化
→ ダウンサイジング (downsizing)
汎用機からワークステーションへ
• 計算作業環境の変遷
– 計算機の配線
– 紙テープ, カード
– 端末
– ディスプレー端末
– ワークステーション(X)
ダウンサイジング第二期
1990 年代後半: パソコン
• ハードウェアの進歩, 普及と低価格化
→ ダウンサイジング (downsizing)
ワークステーションから
パソコン(Macintosh, WindowsとAT互換機)へ
• 計算作業環境からのワークステーションの衰退
– ワークステーションは特殊用途へ
– ほとんどの作業はPCで
• パソコンの登場は1980年代, どちらかというとゲームから出発し, 文
房具(清書道具)として実務で本格的に使われるようになったのは
1980年代後半(DOSの登場と一太郎などのワープロソフト)
Internetの大発展(WWWとブラウザ)
1990 年代後半の爆発 =WWWとブラウザ(1995ごろ)
• 下地
– Windows と AT 互換機 (MS-Intel 帝国)の普及
– Internetの民営化 (ISP, 日本では 1992)
• 真の起爆剤=WWW (サーバ)と ブラウザ(クライアント)
–
–
–
–
–
CERN → Apache
NCSA mosaic → Netscape
WWW = W3 = World Wide Web
html = hypertext markup language
URL = Uniform Resource Locator
(プロトコル://アドレス/ファイルパス名)
– http = hypertext transfer protocol
• 検索エンジン(Yahoo1995,google1998)
情報社会の到来が一般に体感されるようになる
計算機科学・情報科学
V. Bush 1945
V.Bush (1945)
• V. Bush:
• MITの副学長, 第二次大戦中は国防研究委員会議長, レーダー
から対潜水艦作戦, マンハッタン計画にいたるまでの兵器開発計
画の監督.
– 人類にとっての真の挑戦は原子をさらに細かく調べたり
生命の複雑さを探求したりすることではなく, 科学技術が
氾濫させる情報のよりよい管理方法を発見することだ.
• 人間の知識と経験が驚異的な速度で増大しているというのに,必
要な情報を捜し出す方法が依然として「帆船時代」のままなのは
おかしい, 情報を整理する新しい方法と技術が必要である.
V.Bush (1945)
• 「メメックス」(memex)
– 関連がある異種の情報を一つに結び付ける装置
で, これにより, 誰もが自分専用の情報を整理蓄
積できるようになる.
– 弁護士はボタンを押すだけで, 彼自身の経験ばかりでなく 友
人や関係当局の経験から得られた関連意見や決定を呼び出
せる. 弁理士も依頼人の希望に応じて, 数百万件もの特許を
即座に調べることができる. 医師も診断に迷った場合には類
似した症例を手早く調べたうえ, ついでに解剖学や組織学な
どの書物まで参考に引くことができる. 膨大な記録を整理して
誰もが活用できるようにすることによろこびを見いだす, 先駆
的な新しい職業も生まれてくるだろう.
V.Bush (1945)の実践
• 計算機に地球惑星科学の知識を教えていく
こと
– 我々の知識の形を明らかにすること
– コンピュータが相互にやり取りできる知識データ
の構造
– それぞれの専門分野の人々が情報科学の発見
発明を実際に活用して行うことが必要
日本での情報化
• 情報科学者が目指していたこと(計算機に知識を教えていく
こと)のかがなかなか広まらなかった
– 大学は情報化の触媒としてはあまりうまく機能してこなかった
• Unix が情報科学の外側になかなか普及しなかった
• 数値計算する機械と文字処理する機械とはべつべつに発達し,特に後
者は民需主導であった
• ちなみに大学はInernetの触媒としてはうまく機能した(WIDE project :
村井純1988- など)
– 米国のUnixや坂村健のTronがやろうとしていたことがなかなか理解
されなかった
– 日本では 90 年代後半になって, ようやく情報科学がやろうとしてきた
ことたちが知られるようになって来た.
– 知の爆発といわれ,情報収集能力が先進国の基盤として認識される
今日,大幅な出遅れ
参考書, 参考文献
• Bush, V., 1945: As we may think. Atlantic Monthly, 1945
July, 101-108.
• 村井純, 1997: インターネット, 岩波新書 新赤 416, 岩波書
店.
• 村井純, 1998: インターネットII, 岩波新書 新赤 571, 岩波書
店.
• 歌田明弘, 2000: 本の未来はどうなるか 新しい記憶技術の
時代へ, 中公新書 1562, 中央公論新社
• D. Libes & S. Ressler 著, 坂本 文 訳, 1990: Life with Unix,
アスキー.
• 坂村健, 2002: 痛快! コンピュータ学, 集英社文庫.
• 山口 英, 2002: ブロードバンド時代のインターネットセキュリ
ティー, 岩波科学ライブラリー85