雑誌とホームページの同時制作 SGML活用事例紹介 SGMLによる『情報管理』誌の編集・印刷と 電子ジャーナルの同時作成 科学技術振興事業団 科学技術情報事業本部 「情報管理」編集事務局 森田 歌子 1999.4.14 はじめに • SGMLと電子出版 – 『情報管理』誌での活用事例 • 『情報管理』誌SGML編集システム – SGML文書処理システム – 『情報管理』誌SGML編集・印刷システム • 『情報管理』SGML編集の実際 – 原稿入稿から冊子体発行までの実際 • Web版『情報管理』 – SGML-HTML変換の概要と流れ 『情報管理』での活用例 • SGMLによる文書作成・文書処理を目的として開発した JICST-DTDの紹介。 • SGMLによる文書作成・処理・編集・印刷の一貫作業を 実現した『情報管理』誌SGML編集システムの紹介。 • このシステムは,『情報管理』誌1999年4月号の編集・ 印刷作業から運用開始 • 4月号より,印刷物と電子ジャーナル(Web版)の同時 提供を開始(http://johokanri.jst.go.jp) SGMLシステム構築の目的 • シングルソース・マルチユースの実現 • 編集・印刷工程の作業量軽減・期間短縮 • 印刷物,電子ジャーナル,全文DBの作成経費の 重複回避と節減 SGMLと電子出版 SGMLの目的 • 科学技術論文一次情報および二次情報の電子 的交換・流通 • 情報交換・共有における変換・調整処理等の作 業をなくす • データベース作成のための論理的調整(標題・ 著者名・所属等の仕分け)の機械的処理 • SGMLタグと印刷上の編集仕様との対応付けに よる出版物への利用 SGMLとは 1 • 各種の文書・文献を電子化するための国際規格 (フルテキストデータベースや電子図書館のための規 格でもある) • SGMLを直訳すれば「標準汎用マーク付け言語」 • SGMLは文書・文献の電子化に一般的に対応で きる基礎的な方法 • その一つの利用として印刷への応用が可能 SGMLとは 2 • Standard Generalized Markup Language • ISO8879(1986年に国際規格となる) • 1986年にISOで制定された電子的に文書を取り 扱うための計算機言語 • 1992年に日本工業規格になる – (JIS X4151)「文書記述言語SGML」として制定 SGMLとは 3 • MarkupとGeneralized • 編集者が見出しやテキストに書体やサイズ,体裁など の指定を原稿上に手書きで書き込むことで固有と汎用 がある • 固有:体裁を記述するためのコマンドで,使用する印刷 機器やソフトウエア専用 • 汎用(Generalized):文章の構造を記述するもので,見 出し,本文,参考文献等の文章の要素の始点と終点を マークし,ソフトは要素ごとの体裁を指定し,印刷する ので機器によらない SGMLの可能性 • 電子出版(CTSやDTPより優れた点) – 印刷の体裁ではなく文書の(意味的な)構造を記述しているので,ま ず文書DBを作り,それを元に印刷物やCD-ROM,WWWへ利用 できる • データベース – テキストDBが扱える,図表も大丈夫 – 構成要素を指定した検索が可能 – HypertextやHypermedia • 情報の共有(文書等の交換・流通) – ワープロソフト間の互換性や文書作成者の書き方を気にする必要が ない SGML文書の構成 1.SGML宣言 – SGMLを任意のシステムで処理するための宣言 2.文書型定義(DTD) – 文書の論理構造の記述 3.文書インスタンス(実現値) – 文書の本文 SGML文書の構成 1.SGML宣言 • 使用する文字集合,具体構文の有効範囲,使用されているSGML 機能,処理に必要なアプリケーション固有機能等を宣言する • SGML文書を処理する際に必要な機能を受け手に対して明らか にするもの • コンピュータではなく受け手の人が読むもの SGML文書の構成 2.文書型定義(DTD) • Document Type Definition (文書型定義)の略 • 文書テキストの構造をSGMLの構文を使って定義・記述するも ので,論文,レポート等文書の種類によって構造が異なるので, それぞれにDTDも異なる • 階層構造と非階層構造(存在場所を問わない)の両方の記述 が可能 • 文書の論理構造の記述 – 要素の宣言(ELEMENT) – 属性の宣言(ATTLIST) – 実体の宣言(ENTITY) SGML文書の構成 3.文書インスタンス(実現値) • 文書の本文 – DTDに従ってマーク付けしたテキストで,普通のテキストに SGMLの特有のマークを埋め込んだもの SGML化に適する文書 • 文書の構造がしっかりしている文書 (例) ・議事録,伝票等の定型文書 ・設計書,マニュアル類,規格書,法律書等内容の一部に 変更はあるが寿命の長いもの ・電子出版を目的とする文書,データベース化したい文書 SGML文書作成のツール • SGML対応エディタ – DTDに従ってelementの開始タグを画面上に出し,入力する。 開始タグや終了タグを意識せずに入力できる • SGMLパーサ – – – – DTDのチェック 作成したテキストがDTDに沿っているかのチェック SGML形式テキストデータベースへの変換 リンク機能:SGMLテキストデータベースからDSSSLやLaTeX への変換 • フォーマッタ – SGML形式テキストデータベースをレイアウトして出力するソフト ウエアで,レイアウト能力の低いものを簡易フォーマッタという • SGMLの知識はなくてもツールを使えば誰でも SGML文書を作ることができる SGMLによる出版方法 • 従来のCTSなどと基本的な違いはない • 従来の出版システムは組版が直接の目的 • SGMLは文書データベースが直接の目的で組版は二次的に作 られる • 処理の手順が大きく異なるが,文章構造を厳密に規定(書体や 書式の識別等)しておけば,処理手順も工程もさほど変わらない • 文章構造が複雑でデータベースやCDーROM等構造そのもの が重要な場合は,CTSでは対応困難でもSGMLでは効率よく作 成でき,データ処理の作業が楽になる 『情報管理』誌SGML編集システム JICST-DTD開発の目的 • 科学技術論文一次情報および二次情報の電子的交 換・流通 • 情報交換・共有における変換・調整処理等の作業を なくす • データベース作成のための論理的調整(標題・著者 名・所属等の仕分け)の機械的処理 • SGMLタグと印刷上の編集仕様との対応付けによる 出版物への利用 • 1994年1月~1996年3月 JICST-DTDの規定 *『情報管理』誌の文章構造の分析(資料1 p1~3) 論文,講演,連載,ディスカッション,ニュース,図書紹介, アナウンス,文献の紹介の8種類に大別 構造と 構造要素 論文 =ド キュ メ ン ト タ イ ト ル, 著者の詳細+, アブス ト ラ ク ト +, 出版情報, 本文 , 後付?, 参考文献?, 謝辞? 講演 =ド キュ メ ン ト タ イ ト ル, 著者の詳細 , アブス ト ラ ク ト +, , 講演 , , 参考文献? 連載 =ド キュ メ ン ト タ イ ト ル, 著者の詳細 , アブス ト ラ ク ト +, , 本文 , , 参考文献? ディ ス カ ッ ショ ン =ド キュ メ ン ト タ イ ト ル, 著者の詳細+, , , ディ ス カ ッ ショ ン ニュ ース = , , , , ニュ ース ? 図書紹介 =ド キュ メ ン ト タ イ ト ル, 著者の詳細 , , 出版情報, 図書紹介? , , , , レ ポート ? アナウ ン ス = , , , , アナウ ン ス 文献の紹介 =ド キュ メ ン ト タ イ ト ル, 著者の詳細?, , , 内容紹介 , 後付?, 参考文献? JICST-DTDの定義とタグ名の設計 • 『情報管理』誌の文章構造を基にDTDファイル の構造を定義 • 「ISO12083:1994(E)」で規定されたDTD のタグ名を使用 • DTD全体の構成を単純化し,DB検索に必要 な範囲に限定 • 図・表,数式・化学式は内部表記と外部参照を 採用 JICST- DTD TREE構造(資料1 D T D エ ン テ ィ テ ィ p4~9) 二次情報 DTD 基本ドキュメント DTD 雑誌 DTD 予稿集 DTD mt.dtd paper.dtd mag.dtd book.dtd 基本 DTD 構造構成 構成要素 要 素 数 式 化学式 paper.ent info-uni.ent char.ent math.ent chem.ent 1996.04 現在の構造 • JICST-DTDの概要(資料2,3) <!-- ===================================================================== --> <!-- 論文構造エンティティ("paper.ent") --> <!-- ===================================================================== --> <!-<!-<!-<!-<!-- ===================================================================== --> エンティティの説明 --> ===================================================================== --> この構成要素エンティティは、科学技術論文の文書内で記述される, --> 構造に関係する要素を定義している。 --> <!-- ===================================================================== --> <!-- このエンティティファイルでは、以下のような要素を定義している。 --> <!-JICST論文番号(doccode) --> <!-論文タイトルグループ(tigrp) --> <!-ti 論文タイトル --> <!-subt 論文サブタイトル --> <!-著者の詳細(author) --> <!-auname 著者の姓名 --> <!-fname 著者の姓 --> <!-sname 著者の名 --> <!-group 団体著名 --> <!-profile 著者のプロフィール --> <!-photo 著者の写真 --> <!-- +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ --> <!-論文の本文 --> <!-- +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ --> <!-- h1 セクション(レベル1):文書の詳細とセクション(レベル2)が記述できる --> <!-- h2 セクション(レベル2):文書の詳細とセクション(レベル3)が記述できる --> <!-- h3 セクション(レベル3):文書の詳細とセクション(レベル4)が記述できる --> <!-- h6 セクション(レベル4):文書の詳細が記述できる --> <!-- t セクションのタイトル --> <!-- topic 見出し --> <!ELEMENT body - O ((%info-uni;)*,topic*,h1*) -- 論文の本文 --> <!ELEMENT h1 - O (t,(%info-uni;)*,topic*,h2*) > <!ELEMENT h2 - O (t,(%info-uni;)*,topic*,h3*) > <!ELEMENT h3 - O (t,(%info-uni;)*,topic*,h4*) > <!ELEMENT h4 - O (t,(%info-uni;)*,topic*) > <!ELEMENT t - O (%fulltxt;) > <!ELEMENT topic - O (t,(%info-uni;)*) > <!ATTLIST (h1,h2,h3,h4,topic) id ID #IMPLIED > <!-- +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ --> <!-論文の後付け --> <!-- +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ --> <!ELEMENT add-txt - O (t?,(%info-uni;)*,topic*) > <!ATTLIST add-txt id ID #IMPLIED > <!-- +++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ --> <!-ELEMENT MIN CONTENT (EXCEPTIONS) --> <!ELEMENT bibcmt - O (%text;) > <!ELEMENT bibgraph - O (bibhead?,bibitem)* > <!ELEMENT bibhead - O (%text;) > <!ELEMENT bibitem - O (((bibauth*,bibti?,bibsubti?,bibserti?, bibvol?,bibno?,bibed?, bibcount?,bibpub?,bibyear?, bibpage*,bibcode?)|(bibfree))) +(bibcmt) > <!ELEMENT (bibauth,bibti,bibsubti,bibserti,bibed,bibcount,bibpub) - O (%text;) > <!ELEMENT (bibcode,bibyear,bibvol,bibno,bibpage) - O (#PCDATA) > <!ELEMENT bibfree - O (%text;) > <!ATTLIST bibgraph type (reference|quotation) reference > <!ATTLIST (bibitem) id ID #IMPLIED -- 属性:ID --> <!ATTLIST (bibauth,bibti,bibsubti,bibserti,bibcount,bibpub) %a.lang; > <!ATTLIST bibpage type (begin|end|total) begin --> <!ATTLIST bibcode doccode (ISSN|ISBN|CODEN) ISBN --> <!-- 論文構造要素エンティティ("paper.ent")の終了 --> 要素 Paper の属性 type 要素(paper) の属性 (type) 内 容 IP テンプ レート type 備 考 article 論文 report 報告 lecture 講演 commentary 解説 serial 講座 feature 特集 talk 対談 interview インタビュー review レビュー introductory 紹介 activities 日本じょ う ほう 紀行 promenade ぷろむなーど Information ordering technique 情報整理術 A Information of words まんが beginning of the book 巻頭言 beginning of the year 年頭所感 stopover 途中下車 meeting 集会報告 new book 図書紹介 pinup Pi n JICSTnews J I C S T 通信 J S T 通信に変更 overseas 海外通信 国際会議案内に変更 literature 海外文献紹介 editor 編集後記 proceedings 予稿集の論文 *J I C S T 情報界のト ピッ クスを適用 JICST 東西南北に変更 イメ ージデータで対応 コラム終了のため作成せず UP 作成対象外 D T D の基本設計終了後, コラム名の変更や中止, 新規などがあるが, 類似のレイアウト 形式持つもので対応する 『情報管理』誌SGML編集システム • この『情報管理』誌SGML編集システムは,下記の 二つから構成されている。 • JICST-DTDに基づいたSGML文書作成を支援す るツールとしてのJICST-SGML文書処理システム • JICST-SGML文書処理システムで作成されたSG ML文書を使い,印刷物作成のために使用する『情 報管理』誌SGML編集・印刷システム • 参考:資料4 SGML文書による編集・印刷の流れ(シングルソース・マルチユース) (2) 『情報管理』誌SGML編集・印刷システム (1)JICST-SGML文書処理システム 0)原稿入稿,編集 論文の FD,E-mail 電子文書 カタログ 文書 FD,E-mail 1) SGMLデータ作成 JICST -DTD 3)自動組版 カタログ フォーマット処理 レイアウト 2) Import Interleaf5 <SGML>文書 SGML文書 5) Export 6)全文DB データ ベース 7)全文DB 6)SGMLHTML 自動変換 5)データ修正 レイアウト変更 6)版下出力 印刷・製本 印刷・製本 HTML文書 7)電子 ジャーナル レイアウト文書 7)印刷物 発行 4)著者校正 『情報管理』誌SGML編集・印刷システム • WS上で動作するInterleaf5の制御言語であるInterleaf Lispで構築した。 • JICST-SGML文書処理システムで作成したSGML文書 をInterleaf5文書形式に変換し,編集(組版,レイアウト, 文字校正等)を行う。 • 編集が完了したInterleaf5文書を印刷用版下として使用 する。 • 編集の完了したInterleaf5文書をSGML文書として保存 し,電子ジャーナル・全文DB用のデータを作成する。 • 保存したSGML文書をHTMLに変換し,電子ジャーナルと して冊子体と同時に発行する。 システム構築の目的 • 論文執筆者にとって使いやすいツール開発のための試作 • 文書データの一元的管理・多元的利用(マルチユース) • JICST-SGML文書処理システムの実用化 • 編集・印刷工程の作業量軽減・期間短縮 • 印刷物,電子ジャーナル,全文DBの作成経費の重複回避 と節減 システム構築のポイント • 文書作成 – ビジネス市場で普及しているアプリケーションで文書を作成でき ること • 編集・印刷 – 印刷・出版に利用できるアプリケーションで編集・印刷を一貫作 業として行えること • 基本的な文書フォーマット – 電子文書の標準であるSGMLを扱えるアプリケーションを使い, 管理できること • 多様な発行媒体への対応 – 様々な利用者に対応できるよう,様々な媒体(冊子体,Web等) での発行に利用できること • 重複作業の回避 – 様々な媒体での発行は原稿段階から最終発行まで,一貫作業 で行えること 『情報管理』誌の編集・印刷に必要な 組版ソフトウエアの機能 • データ作成の同時性 – 著者校正やレイアウトの変更などの編集・印刷データの修正を, 元のSGMLデータに反映させることができること。 • レイアウト機能 – 二段組みと一段組みの混在が可能で,図表のレイアウトが自由 にできること。 • 柱,脚注が扱える • コラムごとに異なったレイアウトデザインに対応可能 • 日本語の学術文献に合ったフォントを使用できる • イメージデータのみのページが混在できる 導入ソフトウエア • Interleaf5基本(製品) – Interleaf5の基本操作に関する製品 • Interleaf5ブックカタログオプション(製品) – 大量文書管理オプション • Interleaf5<SGMLオプション>(製品) – SGMLのImport/Exportオプション(Leafdocのみ) • Interleaf5<SGML Toolkit>(製品) – DTD組込み,Import/Export処理カスタマイズ用オプション • Perl V5.001(Free ware) – Importの前処理、Exportの後処理時にテキスト変換処理で利用 開発ソフトウエア • JICST-DTD用SGML文書からのImport処理 • JICST-DTD用SGML文書へのExport処理 • JICST-DTDのInterleaf5コンポーネントへの割付 • カタログによるフォーマット処理 – – – – 論文属性用レイアウトカタログ その他の属性用レイアウトカタログ 奥付け(編集後記)用カタログ 目次用レイアウトカタログ • Importの前処理,Exportの後処理 各ソフトの動作概要と流れ タグの割付 タグの順番変更 Entity追加など Interleaf5<SGML オプション> Interleaf5<SGML ToolKit> 『情報管理』誌SGML編集・印刷システム Import Export Interleaf5ブックカタログ 書式管理・Vol管理 Interleaf5基本 (文書編集) 文書編集・構成 システムにおけるデータ変換の流れ ★ SGML文書データ変換の流れ カタログ 文書 SGML 文書 Import処理 Export処理 タグ付き テキストデータ フ ォ ー マ ッ ト 処 理 Interleaf5 <SGML> 文書 タグ付き Interleaf5文書 システムの機能 • Import機能 – JICST-DTDに沿ったSGML文書(DTDの規約に基づいて記述され たSGMLインスタンス)から,Interleaf5<SGML>文書(Interleaf5文 書にSGMLタグ情報が埋め込まれている)に変換する機能 • カタログによるフォーマット変換機能 – ImportしたInterleaf5<SGML>文書を,記事の種類別に書式情報を 変換する(レイアウト)機能 • Export機能 – Interleaf5<SGML>文書を,JICST-DTDに沿ったSGML文書に変 換する機能 このシステムを使うことにより,JICST- DTDに沿って作成されたSGML文書を,版下 作成用のInterleaf5文書形式に変換し,Interleaf5での文書編集が可能。また,校 正したInterleaf5文書を再度,JICST- DTDに沿ったSGML文書に保存し,全文DB, 電子ジャーナル用のデータを重複作業なしに,一貫作業として作成できる システムの機能と流れ ★ 『情報管理』誌SGML編集・出版システムの機能 カタログ 文書 ①前処理 ② Import ③カタログ フォーマット 処理 ….cgm ….sgm ….Tiff …_gml ⑤後処理 …_cgm …_Tif ④ Export SGML インスタンス一式 ①前処理 ------- --- > Import 準備 ② Import 処理 -------- > Import ③ カタログフォーマット処理 -- > フォーマッティング ④ Export 処理 -------- > Export ⑤ 後処理 --------- > インスタンス再現 Interleaf5 <SGML>文書 ImportとExport ★ ImportとExport < h1 id="Xh1X1"><t>は じ め に</t> <p>Science Citation Index (SCI)の引用文献 調査による個人論文の引用分析と Journal Citation Repos (JCR )のImpact Factor (IF) による論文掲載雑誌の評価は,研究業績査定, 購入雑誌審査や投稿雑誌の選定などに今日では 利用者間で積極的に活用され, ISI の当初の目 的とは別に発展的に利用されるようになってい る。もっとも本来どう利用するかは利用者の自 由で,制作者の意図とは必ずしも関係ないのだ が,一私的機関の評価法にこれ程普遍的な権威 が与えられている例は珍しい。そもそもこれら は絶対評価ではなく相対的一般的なもフであり, また伝統的な総合評価ではなく特定の論文ある いは雑誌単位の引用評価であるが,他に信頼す べきツールがいこともあって,これが今日にお ける唯一のいる事実は否めない。</p> <p> 雑誌論文は必然的にその分野で文献引用影 響率(IF)の高い世界の一流誌に < p>結論からいうと日本での引用文献調査は事 実上不可能である。第一に役に立つ二次資料が ないので,一次資料からの途方もない無限の孫 引きを繰り返さねばならない。わずか に SciSearchに採録された一部のquality papers Import SGMLインスタンス < h1 id="Xh1X1"><t>は じ め に</t> <p>Science Citation Index (SCI)の引用文献 調査による個人論文の引用分析と Journal Citation Repos (JCR )のImpact Factor (IF) による論文掲載雑誌の評価は,研究業績査定, 購入雑誌審査や投稿雑誌の選定などに今日では 利用者間で積極的に活用され, ISI の当初の目 的とは別に発展的に利用されるようになってい る。もっとも本来どう利用するかは利用者の自 由で,制作者の意図とは必ずしも関係ないのだ が,一私的機関の評価法にこれ程普遍的な権威 が与えられている例は珍しい。そもそもこれら は絶対評価ではなく相対的一般的なもフであり, また伝統的な総合評価ではなく特定の論文ある いは雑誌単位の引用評価であるが,他に信頼す べきツールがいこともあって,これが今日にお ける唯一のいる事実は否めない。</p> <p> 雑誌論文は必然的にその分野で文献引用影 響率(IF)の高い世界の一流誌に < p>結論からいうと日本での引用文献調査は事 実上不可能である。第一に役に立つ二次資料が ないので,一次資料からの途方もない無限の孫 引きを繰り返さねばならない。わずか に SciSearchに採録された一部のquality papers SGMLインスタンス Interleaf5<SGML>文書 Export Interleaf5<SGML>文書 『情報管理』誌の編集作業 • 執筆者から受け取った原稿を元に,JICST-SGML文書処理シ ステムの入力支援ツールを使用して,SGML文書を作成する。 • 各文書ごとに『情報管理』誌SGML編集・印刷システムにより, 印刷用の版下を作成する。 • 編集作業が終了し,Exportを行ったSGML文書をHTMLに 変換し,電子ジャーナルのデータを作成する。 編集作業の流れ • Import処理 – JICST-SGML文書処理システムで作成した1号分のSGML文書 を記事単位でImport処理し,Interleaf5文書に変換する。 • 組版(レイアウト・編集) – 記事単位に,記事の種類別のカタログによるフォーマット変換をし, レイアウト・編集を行う。 • 著者校正 – レアイウト・編集したものを出力し,著者校正を依頼する(郵送, Fax等)。 編集作業の流れ • 印刷用版下作成 – 著者校正の赤字修正やレイアウトの変更などの編集作 業が全て終了したら,台割(1号分の記事配置)を行う。 – Interleaf5の基本編集機能を使い,表紙,奥付け,目次 を作成する。 • Export処理 – 編集工程での文章構造の修正や文字修正等を元のSG ML文書に反映させるためにExportを行う。 • SGML-HTML変換 – Exportの終了したSGML文書をHTMLに変換し,電子 版を作成する。 システム導入による編集・印刷工程の変化 • データの一元管理 • 編集者と印刷所の役割分担 編集・印刷工程における役割分担 0)原稿入稿,編集 FD,E-mail 1)SGML文書作成 3) 組版・レイアウト 2)IMPORT Interleaf文書 SGML文書 5)EXPORT 6)全文DB 6)HTML自動変換 5)データ修正 レイアウト変更 6)版下出力 印刷・製本 データベース HTML文書 7)電子ジャーナル 7)印刷物 4)著者校正 システム導入による編集・印刷工程の変化 • データの一元管理 • 編集者と印刷所の役割分担 • 作業量軽減と期間短縮 • 経費の節減 今後の課題 • 原稿を執筆する著者が抵抗のないような,簡単 な執筆規定の作成 • SGMLデータ入力支援ツールのエディタ拡張 • SGML編集・印刷の移行に伴う作業の変化に対 応できるような,印刷業界への啓蒙 • システムのレベルアップと操作の簡便性の向上 今後の課題 • 平成12年度以降の電子版(Web版)の提供方法 – 課金システムの検討 – 論文単位の提供方法の検討 • 全文データベースの提供 – SGML全文検索システムの実用化 • 『情報管理』誌SGML編集システムの提供 – JICST-DTDの公開 • XMLへの拡張の検討 – JICST-DTD対応XML文書作成支援ツール – XML文書対応組版ソフト
© Copyright 2025 ExpyDoc