一般社団法人 デジタル情報記録管理協会 第1回 特別講演会 講演日 :2015 年 1 月 24 日(土) 講演題目:「今ふたたび図書館とデジタル化を語る」 講 師 :逸村 裕氏 筑波大学図書館情報メディア系 教授 只今、紹介にあずかりました逸村裕です。タイトルの「今ふたたび」というのか何がふたたびなのか と言うと、私が最初に「図書館とデジタル化」について講演をしたのは 1995 年でした。もう 20 年も前 の話です。その当時、マイクロソフト Windows が一般に普及し始めて、まだ Google も存在しないその 時、何を喋ったかというと、Gopher(ゴーファー)の話なんかしたようなそんな記憶があります。今の学 生さんに Gopher と言っても、何ですかそれは?という状態です。 今回、このお話を承りました。確かな情報をという確かな記録をというこの協会のキャッチフレーズ。 いいですね。そこら辺を話します。司会の方が紹介の際にちょっと口淀んでいらっしゃいましたが、私 の所属は正確には何だという話です。筑波大学は他大学と違ってややこしいことをやっています。大学 の教員は「系」に属します。私は「図書館情報メディア系」の教授としておりまして、そこから図書館 情報メディア研究科に仕事に行っていると。それが正しい理解です。そしてその研究科の専攻長を務め ている。 この記録をきちんと、メタデータ、そういう言い方になるのですけれども、ここら辺も来歴とかいろ んなこの後、各論であるかと思いますけれども、いろいろ正確に辿る。その基本としても自分の例をあ げるのは何ですが、例えば逸村裕。逸村姓のお知り合いがいらっしゃる方いますか?いませんよね?普 通はいないんですよね。私が直接知っているのは 10 人くらいです。私の父親の親族は戦争とその後始 末で死んだので、父はひとりぼっちでした。現在私の家族等々で 10 人ほど。調べてみると日本中に逸 村姓は 60 ほどいます。Google Scholar で探すと 3 人出て来ます。つまり非常にレアな名前であると。 調べついでに戸籍を遡ってみると明治の初めに丹波篠山に居るっていうことがわかるんです。そこを見 に行くと周りは市村さんだけで。市村さんは沢山いるのにどうして逸村さんはいないんだろうなぁと。 人を同定するというのは基本です。今日は話しませんけども、Digital Object Identifier とか関連する話 題はいろいろあります。 世界中の人をどのように同定するか。日本でも同姓同名は多いですし、何処の国でも多い。特に韓国 中国では圧倒的に同姓同名が多い。それをどうするかっていうのもデジタルアーカイブを進めていく上 で重要な要素です。で、また私自身に話を戻すと、逸村裕でググる。多くの自分の写真を含めてたくさ ん出てきます。この経歴を見て、私はいったい何歳なんだろう、いったい何処で何をしてきた人なんだ というそういう感じです。大学図書館員をやってから教員に転じて三つの大学にいました。その間に文 部科学省役人を 6 年程やりました。 現在では社会人大学院生というのも当たり前になりましたが、 当時、 私が図書館員やりながら大学院生だった頃はそういう制度は無かった。また外国で Visiting scholar や っていました。そして学術流情報流通および大学図書館、学術情報基盤、情報探索行動、プレゼンテー ションを中心に研究をやってきました。また来年から同志社大学にも教えるよとそういうことになって います。デジタル関係では大学 ICT 推進協議会、AXIES という団体があります。詳しくはググってね という話なんですが。そこの初期からのメンバーでして、学術教育コンテンツ共有流通部会、通称コン テンツ部会という所にいます。 1 この『変わりゆく大学図書館』という本を 2005 年に出しました。もう 10 年経ってしまいました。こ こには 16 のトピックスがあります。いろんな人にいろいろ書いていただきました。現在では千葉大学 の副学長である竹内比呂也先生と二人で相談して 2003 年から作り始めました。竹内先生はその後、静 岡文化芸術大学から千葉大学の助教授、教授、千葉大学アカデミックリンクセンター長、附属図書館長、 2013 年 4 月からついに副学長という大活躍です。メタデータには書けないんでしょうけども私は大学 において竹内先生の先輩です。 かつて図書館員だった頃、1987 年、 『理工学文献の特色と利用法』という図書を出しました。こんな 本書いていたんだね。と言っても今、理工学の情報っていうのはほとんど電子化して、この時書いたも のって何なんだろうな。 いろいろなことをやって参りました。 昨年の 12 月 10 日にクローズアップ現代、 NHK「読書ゼロの衝撃」に出演しました。取材に応じていろんなことをやりました。これご覧になっ た方ってどのくらいいらっしゃいます?そこそこいらっしゃいますね。一部的に話題になって、NHK すごいなあと。今年の年賀状はこの話題に集中しました。実際には撮影は 12 月 1 日 2 日、学生たちと 一緒にやってそれが 12 月 10 日に放映されたので、撮影に協力してくれた学生たちと一緒にテレビのあ る大きな部屋に行ってそこで見て且つツイッターと2ちゃんねるでリアルタイムでどういう反応があ るか見ていました。これもデジタルとインターネットの時代ですと言えると思います。それを見てると 97%の書き込みはわかっていない、3%くらいはけっこうわかっていて、ほぉーとか思ったりもしまし た。後から貰ったメールも 90%くらいは私の髭とか服とかネクタイとかそういう話、あるいは声が違う んじゃないか、そういう話でして、中身について指摘があったのは 3%くらいでした。まぁそんなもの なんだなと。 今日のポイントです。先ずこれを覚えて帰ってもらう。と思います。今日および明日、各論および実 際の実習でいろいろなことをなさっていただけるかと思いますけども、The best is the enemy of the good.どう訳しますかねぇ。これを念頭に置いてください。 本日の内容です。さまざまな活用がなされる素材としての可能性を生むデジタル化の話の総論を話し ます。図書館関係者が多いということなのでそれ向けの話をするんですが、図書館関係でない人にもわ かりやすく話をしたいと思います。 図書館、公文書館でも博物館でも文書館でも同じなんですけども従来は物を集めて、それを何らかの 形で組織化、つまり探せるようにして、タイトルを付けたり時代区分を付けたりとかいろんなことをし て、そして利用者に提供する。それが基本です。今日ネットワークとつながるということで、ある部分 は従来型のものがそのまま残っている。といっても今日では図書館が提供するもののうち、情報源自体 が外に沢山あります。電子ジャーナルとか電子書籍といったものはそうですし、圧倒的に多いインター ネット情報資源もそう。そこら辺はクラウド技術等々がそれをいっそう発展させているわけですね。あ るいは図書館自身がコンテンツを電子化して提供するという電子図書館とか機関リポジトリ。そういっ たような活動が今、普通になってきています。当然、利用者ももう来ない。かつて図書館に行かなけれ ば図書館の所蔵するものを調べることは事実上できなかった。それが今は図書館にあるかどうか調べて から行く。あるいは調べて予約をかけてから図書館に行く。それが普通の行動になったかと思います。 図書館に足を運んで、情報を入手できない、これほど落胆することはないですから。 お聞きしますけど LINE やっている方?はい。Twitter 見てる方やってる方?Facebook やってる方? はい。デジタル化、SNS 関係というのはやっている人には日常なんですね。一方、やってない人にとっ ては何それ?というそういう状況になってます。但し SNS の特徴の 1 つ、 「フィルターバブル」と呼ば 2 れます。自分の見たいものしか基本的には目に入らない、それに関しての警告も散々行われてますけど も、やはり見たいものを見ているから SNS。そこにおいて一層差が開いていく。差が開くというより多 様化が進んでいるということはあります。 そして、情報量の増大です。1999 年、ピーターライマンカリフォルニア大学バークレー図書館長が 日本におみえになりました。その時、彼が世界の情報量ってのは、ということを調べていました。残念 ながらライマンは 2007 年若くしてお亡くなりになったんですが。その後もうどんどんものが増えてい って、 「0.7ZB」これ何て読むかわかりますか?ってぐらいのもんですけども。1999 年にピーターライ マンが 2EB って言ってた時は 200 京バイトでした。当時の人口で割ると一人当たり 250 ギガバイト。 これだったらまだわかりますよね。何となくギガバイトなら。これが 2009 年になると 0.7ZB、7 垓バ イト。これは予測ですけども 2020 年には 35ZB、350 垓バイト。こうなると一人何ギガバイトっていう 数字ですらない。そのくらいの情報量になっていく。そういうふうに言われています。それはクラウド 技術およびグリッドコンピューティングとかネットワークの高速化によってなされていく。データが転 送できなければ意味が無いですから。30 年前、当時最新のデータサイエンスなんかだとデータの交換は フロッピーディスク。それも 5 インチのフロッピーディスクで手渡しの時代。今や高速ネットワークに よってどんどん世界中が全部つながってという格好になっています。そして今、コストをどこが負担す るのかということでちょっと問題になってきています。これも今更ですけども、文字、テキストだけで はなくて音声画像とか双方向、まぁ SNS が典型的です。またその一方アナログコミュニケーションも 残っています。メールは今では学生にとって携帯やスマホでのやり取り。大学の先生は今でもパソコン メールのやり取り。一方ニコ生とか動画中継とか動画発信も一般化されてます。先日の芥川賞の発表の 時にニコ生で中継していて、ニコ生見てますか?とお二人の芥川賞作家に聞いたら二人とも「見てませ ーん」とあっさり言って、こういう所にもデジタルデバイドってあるもんだなぁということを思った次 第でした。 今日明日の本題の 1 つである地域資料の問題。これも一次資料はすでにある。いや実はあるかどうか わからないものがあるんですけども、それが市町村合併が進むと、あるいは少子化によって等様々な理 由で維持されなくなりつつあります。日本の「蔵」という制度と「和紙と墨」はご承知の通り強いんで すね。洪水に流されるとか火事になる。あるいは虫に食われるということが無ければ。江戸時代から大 量に残っています。今、世界記録遺産に『御堂関白記』を登録しようという動きがあります。『御堂関 白記』は歴史で習う藤原道長の記録、日記ですね。正確に言うと自分の子どもたちに残すための記録史。 これは漢文で書いているわけでそれが生で残っている。そのまんま当時の支配者がその時代から残して いるってのは世界で稀有な例として世界記録遺産。しかも最初の頃の日記は漢文もどきで非常に下手な 漢文。だんだんまともになってきて普通の漢文になっていくっていう、文体としての成長も。もちろん 本人は外に出すつもりがなかったからそんなんで書いたんでしょうけどただそれがいろいろと細々と した記録。例えばいろいろ寺に行ってどういうことになったとかそういう、最近は寺に行くとみんなが 歓待してくれて俺は休む暇が無いとか、そういう今時の政治家みたいな愚痴みたいな、まぁ政治家です けども、見ていても面白い。そういうものが残った訳ですね。たぶん世界的にそういう為政者は記録は たくさん残していたんだろうけど結果的に今に伝わらなかった。まぁ意図的に伝えなかったことの方が 多いんでしょうけども。日本において和紙と墨の記録文化というものがいろいろ苦しくなってきている というのは事実です。ということは誰かがこれから意識的に記録を残さなくてはいけない。更に今、デ ジタルの時代が進むとはいえ、ペーパーモアーというか物凄い量の紙の生産物があります。それがやは 3 り場所が無いから基本的に捨てるわけですね。そこら辺になるとアーカイブ機能の話になるわけですが 大正時代以前の記録よりもかえって昭和、そして現在の平成の方が物が残りにくくなっているんじゃな いかっていう議論があります。また、90 年代以降はデジタル化が進んだので誰かの所に何かがある。そ れに比べると 80 年代 70 年代 60 年代 50 年代あるいは 40 年代、戦争でたくさん破棄したこともありま すがそこら辺が残っている物が少なくなるんではないかと。実際、私も、以前、国立情報学研究所およ びその前身の学術情報センター、学術情報センターは 1985 年にできてるわけですが、そこら辺の記録 を調べようと思って文部省や国立情報学研究所でいろいろ調べたのですが残ってないんですよね。捨て ていると。場所がない、あるいが引っ越しを理由に捨ててるんですね。まぁそれは誰しもそうなんです けども。それで昭和の記録がどれだけ残るのかという訳です。先だってその一部の記録が某大学に山積 みになっているってことを知ったので、いつか時間ができたら見に行こうと思っているんですけども。 いずれにしても確かな記録をということに関しては重々考えて動かなくてはいけないということは申 し上げられると思います。 名古屋大学にが高木家文書というものがあります。これは私が電子図書館に関わっていた時のもので す。名古屋大学附属図書館のコンテンツとしてあります。木曽三川と呼ばれる木曽川、揖斐川、長良川。 愛知県、岐阜県の方にはお馴染みのものなんですけどもそこに於いて交代寄合と呼ばれる旗本ですね。 関ヶ原 1600 年ぐらいから 19 世紀、 明治維新になってもしばらく高木さんという人が支配していました。 そこに 300 年近くそこに住んでいて住民も 3000 人くらいしかいないと。という訳でみんな顔見知りな んですね。その人たちが細かい記録を残しています。メインはその木曽三川。今は護岸工事をやって、 滅多に氾濫することはなくなりましたが、かつては毎年のように洪水が起きて大騒動になっていたと。 それに関しては尾張藩で防波堤を高くしていて、岐阜県側に水が流れ込むようにしたんだっていうまこ としやかな「御囲堤」話がありまして。そういうこともあって、愛知県と岐阜県の当時の仲の悪さとい うものになっていった訳ですが、昭和 35 年頃に名古屋大学であれば岐阜県民の子弟もたくさん学ぶか らってんで名古屋大学に売ったというそういうような記録が残っています。只いろいろと調べるとさっ きのその防波堤が尾張の方が高くてっていうのはどうやら嘘で、あんまり関係無かったとかそういうこ とがわかっちゃったりするところが何とも言えないんですが。まぁそういう因縁付きの文書でした。で、 ここには 10 万点って書いてありますがこの手の物の数え方って何とも言えないんですが、10 数万点あ ってかなり立派な木曽三川の地図とかいろんな物が出て来ます。江戸時代にこういう地図が描かれてい るんですよね。これも見せると深いと思うんですが江戸時代にどうしてこんな地図が描けたんでしょう ね。飛行機が飛ぶ訳でもないのに。つまり当時の測量技術はそれだけあった訳です。今はこんなふうに 川は入り乱れてませんけども、こんな地図を描いて対策を練っていて裁判もやっています。この手のは 木曽三川に限らず江戸時代の治水というところの観点で調べると面白いと。ここら辺こうやってデジタ ル化すると他の治水事業を調べている人と関係が生まれる訳ですね。うちはこういうふうにやった、木 曽三川はこんなことやった、実はこれとこれは関係があるんじゃないかとか、まぁいろいろイメージが 膨らむというそういう訳です。この時問題になったのは、どういうメタデータを付けるか。どういうデ ィスクリプションを付けて誰かがこういうことを調べたい時にどういうふうに探すか。一応これは 2002 年にスタートしたのでメタデータのスキーマをどうするかとかいろいろあったんですけども、とりあえ ずダブリンコアをベースにしていろいろ専門家に見てもらってキーワードを付けようみたいなそんな 格好でやっていきました。 4 同じようなもので伊藤圭介文庫。これも見ていただければいいんですが 1802 年に生まれて 99 歳、数え で 100 歳まで生きた人で、今は誰も知っている人はいないっていう感じですけども、日本を代表する博 物学者でして日本での最初の博士号を取っている人であり、東京大学教授もやってました。実際、明治 の初めに外国から当時流行りの博物学、特に植物に関して見に来た人は伊藤圭介にみんな会いに来るん ですね。例えばスズラン、植物の花のスズラン。あれの学名は Convallaria keiskei ケイスキですね。 つまり伊藤圭介が発見して世界に広めたから。この人がいろんな物を絵を描いたものを残しているんで すね。それに関してメタデータを山のように付けたり。これを見るために元々医者だったので自分の医 者としての技術を使っていろんな大名、旗本の所に行って治療のついでにあの絵見せてとか言って、そ れを書き写して帰って来るというそういう様なことをまめにやっている人でした。さすがに 80 歳を過 ぎた頃になると明らかに筆が震えてるのが分かって、ほぉという感じでした。こういう物もこれを全部、 文字を読み解いてメタデータに起こすというそういうこともやりました。 その際にどういうことを設定してどういうふうに提供するか。っていうことは考えて記録を残しておく と 10 年後に見た時に、あぁこの時はこういう時代だったのね。あるいはこういうふうに考えたからこ うなってるんだということがわかる。これは仕様書という言い方になるわけですけどもこれがやはり大 事です。10 年経つともうわかりません、何も記録しておかないと。あるいは人の記憶はいろんなフィク ションが混じってます。今日はこれ以上話しませんが、人も変っていくと。今グーグルのない生活って いうのは学生には考えられません。30 年前どうやって暮らしていたと思う?と言ってもまったく想像で きない。学生にはレポートで 1995 年の学生はどうやって日々を暮らしていたかストーリーテリングで 書け、そんな宿題を出すんですけども。どうやって調べたらいい?っていうまぁそういう話になる訳で す。携帯なんか無いなぁ。あったけど高かったよとかね。実はこれ今日の参加される方の年齢構成がわ からなかったので一応両方、用意したんですけども。今デジタル・ネイティブという言葉が使われてい ます。今時の学生ってやつですね。物心ついた時からインターネット、携帯、スマホ、動画、電子情報 が出回っていた環境に居たと。私の子ども、幼稚園の頃からネットを使って物を探すってことはこうい うことだと叩き込む。そんな教育方針で臨みました。で一方では読み聞かせとかやって、本も読むんだ、 とかそういうことをやりました。私のような世代はデジタル・イミグラント。移民である。成長してか らデジタル技術に習熟したという。習熟したかどうかわかりませんが。まぁどんどん新しい技術が出て 来るのに対応するという訳です。 さて、デジタル・ネイティブの特性。学生さんもいるようなので微妙なものですけどもここに 6 点あげ ました。多数派と思うものに○、そうでないものに×を付けてみてください。順番にいきます。手を挙 げてもらいましょう。○が付くと思う物に多数派がと思うものに○を付ける。PC リテラシーは高い。 だからなんてことは聞いたりしないのでお気軽に。はい。書くのにパソコンが便利である。インターネ ット=パソコンである。これはさすがに思わない?ノートパソコンは画面が小さくて不便だ。テレビを 話題にしなくなった。動画とは見るものだ。まぁいいです。はい。これ実際には全部×です。多数派と いう言い方にしておきます。別に全員が全員、100 人が 100 人ではないんです。これが特徴なんですけ ども、PC リテラシー。中学高校において情報科教科情報というものが必修になってもう 10 年が経ちま した。しかしそもそも私は 1 年生、筑波大学の知識情報図書館学理で 1 年生が最初の学期で情報基礎実 習というそういう科目を必修科目でやっています。100 人の学生に TA が 6 人付いて全 10 回、毎回レ ポートが出て真っ赤にして返すという、そういう授業なんです。率直に言って特にこの数年、PC リテ ラシーは落ちています。何が上っているかって言うとパワーポイントの使い方が習熟してくるんですよ。 5 ワードやエクセルはだめ。ましてもう CUI(Character User Interface)なんてわかりもしない。全部そ れも GUI(Graphical User Interface)でやるのでコマンドラインで打ち込むなんて全く理解できない。 c のインターネット=PC であるっていうのはそういう訳でもうスマホで充分と。ですから d のノート パソコンは画面が小さくて不便なんて思いもしない。もうベッドの中で寝っころがってスマホいじって いうのは基本形ですね。テレビを話題にしなくなったっていうのもこれも全員が全員ではないですけど も、むしろテレビを見ながら、さっきクローズアップ現代を見ながら学生と Twitter と 2 チャンネルで わいわいとと言いましたけども、まぁそんなことは普通にやってます。特にアニメ関係だと Twitter は 炎上しますよね。 サッカー、 ワールドカップとかそういう時はみんなこう Twitter もやりながらでした。 そういう意味ではテレビを話題にしなくなったというよりはその物によっては非常に話題になる。そう いう訳なので動画とは見るものではなくて参加するもの。そういう感じですね。そういう今時の学生が あるということ、これはもう説明しませんけれども Google は圧倒的なシェアです。そこで探すという のが当たり前。それに対応したデジタル化というものが必要な訳です。探して出て来なくてはいけない。 最初に申し上げた通り情報量はどんどん増大しています。その中で何が出て来るか、何が出て来ないか。 検索して出て来ないものは存在しないのと同じ。そういう扱いになってます。一方で決して学生は 1 つ ではありません。いろんな考え方、いろんな情報技術、いろんな思想を持っている人間がいます。ggrks 意味わかる人?はい。ググレカスと言いまして。ネットで探すとちゃんと説明が出て来ます。古代ロー マ帝国の元老員議員である。気になった事柄、自分の力で調べるのが良いというそういうことわざを残 したので、今に伝わっている。可笑しいでしょ?知っている人はわかるんですけども。これはジョーク です。ググれカス、2007 年くらいから学生が使い始めたと思いますが、それを後になってこういう如 何にもウイキペディア風のアンサイクロペディアというのでジョークで誰かが作ったんですね。これも きちんと知らないとローマの元老院が本当だと思っても何もおかしくない訳ですよね。わかっている人 にはわかっている。そういう状況に今やなってきています。これはフィルターバブルとの関連もあって そういう中でどうやってデジタル化を進めて、何が確かな記録か、っていうことは重々お考えください。 とそういう話になる訳です。 いずれにしても今の若者は呼吸をするように Google を使う。わかる人にはジョークだとわかっても という、そういう情報の真正性って何?っていうそういう話になる訳です。で、繰り返しですが、情報 量はどんどん増大していきます。で、それをどうきちんと作るかっていうのがこの講座の大きな目的な んですけどその一方で、探すことができなければ存在しないのも同じと言うからには、探されるからに はきちんとしたものを作っておくというそれが必要であるということを申し上げておきます。後、これ も当たり前の話ですが一方でサーチエンジンオプティマイゼーション、SEO と呼ばれる、ちょっと前よ く流行りました。サーチエンジンというのは、これも皆さんもそうだと思いますが前の方を 1~2 件し か見ないですよ。260 万件と結果が出て来ても最初の数件しか見ない。意図的にサーチエンジンの検索 結果はいじることができる、そういうことは知っておいてください。 さて、デジタル化の現状です。今更言うこともないですけどもとにかく今はもう Born Digital という ものが増えてきました。その中でこれから作っていく。撮影とかそういうさまざまなもの。あるいはデ ジタルアーカイブ、スキャンしたりとかいろんなものがある訳ですが一応それに関しての現状をざっと 話をしておきましょう。先ず学術の世界においてデジタル化が急速に進んだのはやはり電子ジャーナル だと思います。特に STM、科学、テクノロジー、医学。も今、学術論文は年間 300 万件を超す。電子 ジャーナル 2 万誌あるって言われています。電子なんだから 1 誌とか 2 誌とか数えなくたって論文 1 つ 6 1 つで数えられるじゃんっていうそういうことなんですけどもそれでも今でも何誌と言います。むしろ ブランド化がいっそう進行しています。ネイチャー、サイエンス、そういった学術誌は今、中学生でも 知っていますよね。どうしてなんですかね。皆さん、ネイチャー本体を見たことあります?もちろんネ ット上で紹介されてそれを見たことあるでしょうけど、ネイチャーって大きな書店に行くと今でも紙で 売ってるんですよね。見たことあります?って 1 回見てください。これがネイチャーの紙か。週刊誌で すからね。ネイチャーもサイエンスも高いです。でもそれは大学に所属してたりすると、あるいはネイ チャーの中でも有名な論文は無料で公開されるっていうそういう選択的なことをやっています。で更に それをニュースに流すように意図的にネイチャーがテレビ局や新聞社に情報流すんですね。ですから小 保方さんの例の話が理化学研究所が広報に何とか使ったとかそういう意味での悪口を言われています が、そんなもの別に普通なんであって、あれが大当たりだったらあれはあれで正に流行ったはずな、ね。 またその学術雑誌。従来型は非常に値段が高かったんですけども今はオープンアクセスジャーナル、無 料で読める電子ジャーナルも増えています。いわゆる学術雑誌ではない普通の雑誌、一般雑誌ですね。 マガジンと呼ばれるもの。これはもう今や印刷体、かつて冊子体と言いましたけど。印刷体とオンライ ン、あるいは目次だけでもオンラインで出す、というのが増えてます。あるいはオンラインのみとか、 あるいはあくまで印刷体のみ、で生き残る戦略っていうのがあります。ただ、ほぼオンラインと組まな いとやっていけないだろうと。例えば新聞の中吊り広告。週刊誌がもう中吊り広告やめるっていうそう いう話もありますが、かつてのサラリーマンとしてはあれで満員電車の息抜きに使っていたのが、もう みんなスマホ見てるから要らないのねっていうそういう話です。ただ一方で週刊誌をやっている連中に 聞くと、 「まずいんだよな、いろいろ」とか言ってます。というのは、週刊誌、かつては売れても 30 万 部とか 50 万部でした。で、書きっぱなしで良かったんですね。ところが今はオンラインである程度出 すんでそれに残っちゃうんですね。で、後になって検索されて散々叩かれると。昔は見る人が見てけっ こう飲み屋の話題になっても 1 週間で話題が消えたからそれでスッと行ったんですけども。今いつまで も残る。出版社がそのデータを削除しても誰かが、いわゆる魚拓なんて言ったりしますが、残すと残っ てそれが SNS 等で拡散すると、あの時この出版社ではこんなことを言っていた、書いていた、みたい なことで叩かれる。困ったもんだなとそういう話をしています。で、これも大学の関係者ですとご承知 の通りですが機関リポジトリという名の大学あるいは研究機関が設置して自分たちの大学の教員や学 生が作成した論文や教材をインターネット上で無料でコンテンツとして提供すると。オープンコースウ エアとか MOOCs もそれと似たような所がありますが、急速に増えています。特に CiNii が API 公開 して Google で直接、大学の機関リポジトリのコンテンツが探せるようになった結果、かつてそれこそ 紀要論文にこそこそと論文を書いても誰も読みはしなかった。ほんとに誰も読んでなかったんですけど も。それが今や容易に世界中誰でも読めるようになった。良い部分もあって例えば学生が新しく専門の 授業を取るんだけど、この先生どんな論文書いてるのかなってのがスマホで探すとすぐ機関リポジトリ のコンテンツにアクセスして、その教員が書いた論文を読むことができると。あるいは今日、授業で紹 介されたのちょっと調べたら、あぁなんだ、この論文の話を先生はしてたんだってことが確認できると。 やる気があれば更にその先をっていう風に教育にも良い効果を与えている。そんな時代になってしまっ た。基本的にインターネット上で無料でコンテンツを提供されているからなんですが、問題はこのコス トを誰が負担しているかです。機関リポジトリは大学や研究機関が負担しているということになります。 人件費も当然コストですし技術的なものもそうです。今は国立情報学研究所がクラウドを提供したりし ていますがそれも元はと言えば税金。ということになります。更にオープンアクセスジャーナルと呼ば 7 れるインターネット上で無料で読めるものがあります。PLOSONE、いまや年間 2 万件以上の論文が発 行されています。なぜ無料で読めるかっていうとそれは論文を載せる著者がお金を払っているからです。 そのことは APC、アーティクル・プロセッシング・チャージと言って 1 論文当りいくらなのかってい うのは物によります。1 万円という所もあれば 30 万円という所もあるし、そのコストの問題はありま す。 電子書籍です。電子書籍読んでますか?キンドル等、アイパッドでもなんでもいいんですけども電子 書籍を買ってお金を払って読んでいる方?はい。まずそんなものだと思います。これがどうなっていく かっていうのはやはり大きいですしデジタル化においても非常に大きいです。というのは後で申し上げ ますいわゆるハイパーリンですね。電子書籍であればいろんな種類いろんな書式があるからですけども、 ハイパーリンクを貼るとさまざまなコンテンツにそのまま飛べる訳ですよね。それはやはり電子ものの 強味である。ハイパーリンク自体はずいぶん前から考え方としてあった訳です。逆に言うと電子書籍が 普及すれば普及するほどさまざまなデジタルコンテンツへのアクセスの機会が増えます。サーチエンジ ンで探すってのはあくまでそのワードを入れなければいけないわけですよね。電子書籍でハイパーリン クが貼ってあれば、そこが伝わればそのまま飛んで来て見てもらえると。そういう環境にどんどんなっ ていきます。電子書籍に関しても、電子書籍元年ってのはいったい何回あったんですか?といいつつも ようやく本格的な普及がなされるようになってきました。これはでデータの信頼性はともかく、という 話ですが、Kindle とか楽天 Kobo とか紀伊國国屋 Kinoppy とかさまざまな所の合計は 20 万点を突破し ました。もちろんいろんな問題はありまして。例えば同じ著作が異なる出版社から出ているものもおお くあって数にばらつきがあったりしてるんですね。いずれにしても増えていっているのは間違いがない。 環境も整ってきている。 電子書籍といっても人間、基本的には保守的なもので、さまざまなクレームというか愚痴というかそ ういうものもあります。実際読みやすさって何だろうってのは真剣に考えるとこれはこれで面白い。紙 と電子っていつまでも比較されるのでしょう。そのうち電子がベースで紙が比較される時代が来るんじ ゃないのとか、フォントと行間と字間と余白っていうのとかポイントですね。私はポイントが大きくて 行間が開いている本を読むのが苦痛なんですけども。まぁそういう人もいると。あと若い人とエルダー の人。あと量ですね。よく言われますが紙だとあと何ページで終わるって感じがわかる。推理小説であ れがわかんないのは辛いんだ俺は、というそういう人もいます。この問題っていうのは日本において教 科書が小学校中学校高校の教科書が紙である以上は、当分続くんだろうなと思っています。ただそれを 電子にしてしまうとどうなるかってのは実はよくわかんない。韓国がいち早くやりましたけれどもやめ るって話もありますし、なかなか電子黒板って普及しない、特に考える時に黒板の方が良い。いずれに しても現状まだ進捗している段階で 5 年後にどうなるかはまったくわからない。フリーライダーの問題 というものはこれも残るだろうと。電子書籍に関してはいくら払うかというこの部分、いくら払って納 得できるかっていうそういうところをどうするか。だと思います。 今やこのデジタル化というのは書籍や雑誌だけではないのはもちろんです。国をあげての競争になっ ています。という訳で、一昨日の話ですが、Europeana と国立国会図書館サービスというデジタル文化 資源の情報基盤を目指してという国立国会図書館のシンポジウムが行われてました。こういう内容で、 さっき調べてた時点では中身は公開されていませんでしたが、おそらくまもなく公開されると思います。 パワーポイント資料等々が。けっこう中身もあったんですけどもやっぱりこれは聞かないとわかんない ですよねっていうそういう感じでした。正にここの協会の話と大いに絡む話でしたので資料公開の際に 8 はたぶん翻訳も付くんじゃないかと思います。さまざまな点で示唆に富む内容だったと思います。一応 今日の聴衆の皆さんはあんまり聞いていなかったようですのでちょこっと話をします。ここでの話は Europeana だったんですけども国をあげての競争。 EU も 1 つの国として見た場合ですが例えば DPLA。 。 DPLA でググってもらえばこういうのが出て来ます。アメリカは歴史が無いから資料が無いとおっしゃ る方もいます。歴史が無いのは事実ですが資料およびそれに対しての意識は日本より高いと言い切れる と思います。歴史が無いことがわかっているだけに物凄く物を大事にするんですね。写真をもう次から 次へとデジタル化していると。もうこれ自体は 1990 年代からすでに盛んに行なわれていましたし。例 えばサンフランシスコ公共図書館。アメリカの公共図書館でもいち早くデジタル化に取り組んだ所です けどもここは膨大な写真を早くからインターネット上にあげてました。あるいはアメリカンメモリーズ と呼ばれるアメリカ議会図書館がやっていたリンカーンの手紙とかそんなものようなものはほとんど やったのに今どんどんこうやって集めて、今ではこの DPLA、デジタル・パブリック・ライブラリィ・ オブ・アメリカという格好で集中化しています。さまざまな物を載せてメタデータを付けて紹介して更 に、っていうようなことをやっています。ピッツバーグ歴史博物館。その中で遠くから見てスポットラ イトを当てられているケースがあったんですね。混んでたんでなかなか進めなかったんですけど何がそ んなふうに展示してあるんだろうと思ったんです。博物館ですから物ですよね。そしたら何も無いんで すよ。えっと思って、ケースがあってスポットライトが当たって。何だろうと思って近づいて読むと、 探していますてと書いてある。炭鉱で働いていた労働者の靴を探しています。靴は消耗品でぼろぼろに なるまでみんな使うので残っていない。しかしピッツバーグの歴史において炭鉱ってのは非常に重要で あったと。人種別に働いていたんですってね。人種あるいは宗教別。だからギリシャ人のグループとか ドイツ人のグループ、全部別々にやってて大きな陥没事故があったんですけどもその日はギリシャ人だ けは働いてなかったからギリシャ人はみんな生き残ったとか。とにかく靴が無い。あの頃労働者どうい う靴を履いていたのかと。写真も無いんですかね。あったらここに飾りますから教えてください。ほぉ ーと。歴史を思うってのはやっぱりそういうことなんだなーと思ったりもしました。アメリカの例です。 EU はユーロピアーナです。ユーロピアーナは EU およびその周辺を含めてすべての文化遺産をデジタ ル化しようという大プロジェクトです。これもスタートした頃からいろいろあったんですが今回その説 明に来たコンテンツ部門の責任者のイギリス人は、学術出版以外は全部やると言ってました。何で出版 物を除くかというと、それは出版社が居るからと。権利関係めんどくさいからもうそれはとりあえず先 送り。今やれることはどんどんやっていくと。そういうことを言ってました。日本語でもけっこう紹介 されていますし、ある方は我々はジャパンユーロピアーナを目指すとか言ってて、それは意味がわかん ねえだろうとか。もうとってもインスパイヤーされているということを繰り返してましたね。 コンテンツを作るのはいろんな所。更にそれをそれぞれの意味でまとめるのはアグリゲーターまたそ れぞれ。それを更にプラットホームとして展開する。これはこの DPLA でもユーロピアーナでも NDL サーチでも共通したやり方です。つまりそうでないと進まないんですね。この点も承知しておく必要が あると思います。この辺もこれからどんどん議論が進んでいきますし発展していくことと思いますが、 とりあえずこの項はこういうことです。 逆に言うとこれやらないと忘れ去られるんです。今、学術の日本研究の世界で議論になっているのが 日本研究に関してのさまざまなコンテンツのデジタル化が遅れた訳ですね。その結果、アメリカやヨー ロッパでの日本研究が衰退しています。何故かというと日本の原資料はデジタルで手に入らないもんだ から、その間に中国や韓国はどんどんデジタル化進んで資料が手に入るものから研究が進むと。その結 9 果かつてアジア系図書館といえばそれは日本が一番だったんですけど今完全にチャイニーズ、コリアン に負けているとそういう状況です。そこら辺は国をあげての競争です。繰り返しですけどいくら払うか っていうのは重要ですし、良い情報の制作にはコストが掛かります。一方で図書館の無料原則。インタ ーネットあるいはオープンアクセスとか、CCBY とか今回ユーロピアーナもしきりにそれを議論してま したけどもどういう形で提供するかっていう。基本的にはオープンで無料だと。だけど作るのにコスト が掛かる。そこら辺どんどん議論が進んでいくことと思います。 この The best is the enemy of the good.完璧なものを求めていると先に進まないんですよ。どこで 見切りをつけてこれでやるか。ということ。それは必ず確かな記録っていうことは意識してください。 後は、まぁちょっと補足的な話だけしておきます。技術動向です。技術はどんどん進展していきます。 バズワード的に最近だとオープンデータなんていう言い方をしますけど何だかよくわからない。けどま あみんな使ってるし何かいろんな意味で使っている。それをきちんと捉えた上でということです。例え ばその今、オープンデータというと非常に大きな流れでは政府公共機関が自分たちの持っている統計デ ータ等を無料で出す。あるいは集めたデータを無料で出す。と言われています。それは事実。もう 1 つ は学術の世界で特に自然科学系で論文を書いたらその背景のデータも一緒に出すという訳です。ですか らデータを見ればそれが偽物であるかインチキしているかっていうことがわかるというそういう意味 です。ただそれどっちも誰かがまとめてそれこそアグリゲートしてまとめている訳ではないので、これ どうするかっていうのは次の段階で必ずやって来ます。その際に必要なのは標準化です。こういう形で こうなった。メタデータにおいてもこれはこういう格好で使えるものであるってことをきちんと記述し ないと、今はわかっているからいいんですけども 5 年 10 年したらすぐわからなくなります。そしてコ ストです。ムーアの法則がありますのでどんどんコストは下がってますが、下がったからいいかってい うとっていうのは逆にまたさまざまな問題を生んでますし保存という問題に関わります。これもさっき 申し上げましたが、マルチメディア対応これは必須です。どういう格好で対応するか。特にその先のリ ンク切れへの対応です。これ日本、まぁこれ以前ウイキペディアのリンク切れ状況を大学生院生がちょ っと調べたんですけど日本だめなんですよ。特に新聞社。海外は BBC なんかすごいです。99%くらい 残ってるんですよね。 図書館員向けには図書館が目録規則、あるいは分類という名で培ってきた組織化技術。これをどう発 展させるかです。メタデータ。分類の問題。人間ってどうしても分けて考えたいんですよね。そこら辺 を総合した組織化っていうのはこの DC ダブリングコアにしても、FRBR にしても、RDA にしても、 DOI にしてもどうなるかわかりませんが、いずれにしてもどの団体も標準化を目指してますし、それは ある意味戦いです。DOI 対 ISNI、どっちが勝つのかとか、あるいは両方生き残るのか、両方対応する のかとかさまざまな所があります。 また今回ターゲットになっている地域資料にどういうふうに対応するか。先ほど高木家電子図書館を お見せしました。あれは地域資料というより歴史資料ですが地域資料の側面もあります。あの中でずっ とわからかったんですが絵図の中で大きな池が書いてあるんですね。直径 2 キロくらいの。どの図面に も出て来るんですよ。今こんな所に池ないじゃんと思って現地調べに行って、役所を調べたら江戸時代 に埋め立ててるんですね。今の地図には残ってないんです。記録もほとんど無かったんですがたまたま 見つけて本当に池があったんだと。これをみんなして埋め立てたんだということがわかりました。ちな みに地図関係に明るい方はご承知かもしれませんけど、さっきの川がぐちゃぐちゃだったのと同じで江 戸時代の地図と現代の地図の情報をつなげるのは大変です。だいぶ川の位置が変わってるから。日本の 10 場合。海岸線もずいぶん変わってますからね。地名もそのまま動いて行ったりするので非常にややこし いです。そこら辺、地域資料を扱うと必ず出て来る問題です。 事例です。これも 1 つの大学の事例として見ていただきますが。エディンバラ大学です。エディンバ ラ大学、スコットランドにある大学ですが、ご承知の方もあるかと思いますけども 1583 年からある大 学です。日本で最近流行りの大学ランキングで世界 17 位。東大や京大が 50 位とか 70 位くらいですか らそれよりはるかに上なんですが。そこの人が昨年 11 月におみえになって 1 日付き合ったんですね。 東大に行って、あと筑波に行って図書館員たちとディスカッションして、翌日は図書館総合展で講演を していました。その時の日本に居た時のブログです。彼が書いているんですけども。まぁこれはこれで エディンバラ大学見ていただければいいんですが、日本だと電子図書館と機関リポジトリって全然別物 ですよね。昔、電子図書館で貴重書とかあんまり受けなかったんで、そういう負の遺産を払拭するんで 機関リポジトリやってるっていうそういう感じですけども。これ見ると、同じ扱い。大学および大学の 関係するもの。だからエディンバラ大学はグラスゴー大学と並ぶスコットランドの有力大学だから地域 資料もこうやってどんどん提供すると。で、デジタル化して出すと。これも全部、大学および地域の物 だと。そういう。本だって同じだし雑誌だって同じだし、あとカレンダーくれたんですけどもきれいな 16 世紀のジェームス6世の戴冠式とか。まぁそういったようなものカレンダーにして。で、隅っこに小 っちゃく書いてある。このカレンダー気に入った?気に入ったらぜひ大学に寄付して。そんなことが書 いてあるんですね。言ってました。お金は掛かると。でもこれやらないと大学が良くならない。大学の reputation(評価)。そこら辺のためにやっているんだと。エディンバラ大学は世界 20 位以下になっては ならない。その一翼を自分は担ってる。という訳で電子図書館と機関リポジトリと更にデータライブラ リですね。先ほど申し上げた研究者の研究データのバックアップも自分たちがやると。それは大変なん じゃないの?と言ったら、いや大きいデータは研究者は別の所で預けるので、大学に預けようっていう 研究データはそんなの大きなものじゃないから、メタデータをきちんと研究者に付けてもらえばそのま ま維持できるというふうに言ってました。活発にいろんなことをやってたんですが、34 歳とおっしゃっ ていました。そんなに若くて部下は何十人いるって言ってましたからね。やっぱりこう、やる人はやる んだ、というそういう感じの話。ちゃんとしかもこうやって日本に行った記録を残している。まめな人 だなぁという感じでした。これは 1 つの例です。JISC との連携とか、ユーロピアーナのことも当然見 ていて、ユーロピアーナにデータを提供することもかまわないというそんなような話もちょこっとして いました。それが世界の1つの事例であるということだと思います。ちなみに最後のデータキュレイシ ョンについては日本図書館協会が出している『現代の図書館』2015 年3月刊行に筑波大学院生の池内 有為が書いています。 これも技術的な話なんですけど考えてみてください。誤ったデータをどうするか。これは図書館選書 にも関わる訳ですね。いわゆる偽科学的な本、『水からの伝言』とか、ああいう本を図書館はどう扱う べきか。あるいは昨年、『情報管理』に私が東北学院大学の佐藤義則先生らと一緒に書いた論文。私の 名前が間違ってたんですよ。オープンになってから情報管理の方が先に気が付いて、いや著者校正をき ちんと見なかった私が悪いんですけども。それ直すのは大変でした。一旦データベースに登録している からそれをどうやって直すかってのが問題になりました。間違った言葉。間違ったことにはそれなりの 理由があるわけですよね。それどうするかっていうのはやはり面白い話です。 さてインターネット上のデータの削除は難しい。一旦データを公開して、それを誰かがインターネッ ト等で回したら永遠に流れます。またある部分沈静化してもまた数年後に突如として流れるってのはよ 11 く起きます。まぁだからちゃんとやろうねって話なんですが。それと後、何度か言ってますがいわゆる フィルターバブルって呼ばれるサーチエンジンのサジェスト機能です。研究が進んでこの人はこういう のが好みなんだなぁってことで、グーグルで検索しても大学の実習室隣同士で学生が同じキーワード入 れても違う結果が出て来るようになりました。従って関連する情報の羅列なんですけども中には不都合 なものとか身に覚えがないもの、そういうものが出て来ます。その結果、自分の見たくないものは出て 来ないっていうそういう言い方になるんですが、ただそれは、デジタルアーカイブの視点からすると非 常によろしくない話になります。ここら辺は後で調べてもらえばいいんですけども。さまざまなあって はならない間違った事件というそういうものが裁判になっているものでもたくさんあります。これは別 に日本に限ったことではなく EU でもアメリカでもさまざまな議論がなされています。興味のある方は ググっていただければいいんですが。データを作った人間の責任、人間っていうかその組織の責任も無 い訳ではないです。それは先だってのグーグル訴訟でもそうですね。もう自分は懲役刑済ませたんだか らデータを消してくれっていうそういう裁判でした。その中でやはりベストは目指すものであって実現 するものではない。たぶんその時点で good が何であるかっていうことです。これは後、フリーライダ ーへはどう対応するか。フリーライダーはあると認めざるを得ないと。問題はその先でどうコストを回 収するか。です。で後はそのアグリゲーター。まだこれ日本では非常に議論が薄いので将来的には非常 に重要になりますが、プラットホーム、NDA サーチのようなプラットホームも重要ですが、アグリゲ ーター問題もぜひ考えてもらいたい。最後にですが、デジタル情報源、デジタルコンテンツってのは著 作権の問題で話は出ると思います。基本的に交渉事になります。著作権を売り渡すとかそういうことを 含めて。で、そこら辺に関してはやはり交渉力、コミュニケーション能力というのが重要になります。 信頼関連にしてもいわゆる契約全般、契約書をどうするかっていう問題もまた別途あります。そこら辺 はジャスティス(JUSTICE)、これも大学図書館関係者はご存知かと思いますが、国公私立の大学図書 館が連合して電子ジャーナルの契約をする際に作っているコンソーシアムの名前です。こういう所はそ ういう交渉をやっています。そういうのは今後、デジタルコンテンツの権利関係においても重要になる だろうと考えています。と、いうところで私の講演はお終いです。どうもありがとうございました。 12
© Copyright 2024 ExpyDoc