121028日本思想史学会プレゼン1030版

同志を求む! 時事新報社説執筆者認定作業
静岡県立大学
平山 洋
日本思想史学会大会個別発表
於愛媛大学・2012年10月28日
1 社説執筆者認定作業の現状
①
②
③
④
大正版全集「時事論集」224編
昭和版続全集「時事論集」1246編
現行版全集「時事新報論集」①+②+新発見分
さらに草稿発見分を別巻と福澤年鑑に収録
つまり福沢が関与したとされる社説は、
増補されたことはあっても、外されたことは、
ない!
2 福沢無関与の証拠など提示できないから
外せない、しかし…
①
②
③
④
大正版・昭和版の社説を選んだのは石河幹明だけ
どのような判断基準だったのかは、不明
記憶に基づくのだとしたら、入社前の3年分をどう
やって選んだのか
文体判定ができたのなら、なぜ草稿残存108編中
59編が大正版と昭和版から落ちているのか
石河は文体判定などできなかったか、あるいは、
福沢の社説と知っていながら未収録としたことになる
3 現行版全集「時事新報論集」は信憑性に乏しい
①
石河に判別する能力がなかったにせよ、福沢真筆と
わかっていながら全集に収めなかったにせよ、いず
れにしても現行版への社説採録は信じられない
②
現行版「時事新報論集」を一旦無効とし、『時事新
報』紙面から新たに選びなおす必要がある
どのようにして?
4 プロジェクトの説明
①
②
既存のホームページ「平山洋氏の仕事」の活用
アップ済エントリ「福沢健全期『時事新報』社説・
漫言一覧及び起草者推定」を完成させる
ⅰ 平山が福沢筆の可能性のある社説を「一覧」と
リンクさせる
ⅱ グーグルのサイト内検索機能を用いて、該社説
の用語・文体が福沢と一致するかどうかを調べ
る
ⅲ 一致する場合はカテゴリーⅠ(福沢真筆)の認
定を行い、一致しない場合は他の社説記者との
類似性を調べる
ⅳ 社説の判定について、広く一般の意見を募る
5 まず「平山洋氏の仕事」をクリック!
①
「平山洋氏の仕事」または「平山洋関連」を検索
する
②
目次から「福沢健全期『時事新報』社説・漫言一
覧及び起草者推定」を選択
ⅰ
掲載日・社説等タイトル、いずれでも当該社
説等に到達できる
ⅱ
全集収録社説については掲載全集名、草稿残
存の有無は入力済み
③
カテゴリー判定は随時実行中
④
訪問者としての意見は [email protected] まで
6 平山洋関連とはこんなページ
7「福沢健全期『時事新報』社説・漫言一覧及
び起草者推定」とはこんなページ
8「起草者判定」のページから
全集未収録社説のページへとべる
①
全集収録済社説は全集で本文が読める
②
未収録の社説全てについて画像ファイルを掲載し
て訪問者にも読めるようにする
③
画像ファイルは随時テキストファイル化して、検
索が可能となるようにする
実例 明治15(1882)年3月9日掲載「朝鮮国の変乱」
の場合 <次のスライドへ続く>
9「朝鮮国の変乱」は石河が採録しなかった社説
10 表題をクリックすると
本文の画像ファイルが出る
11 画像ファイルに加えてテキストファイル化
も進める=検索が可能となる
①
なるべく多くの全集未収録社説をテキスト化する
②
サイト内検索機能を使って判定の効率化を図る
③
より多くの研究者の協力によって、より確度の高
い福沢諭吉の社説集を完成させる
発表者の推定では、福沢諭吉の真筆(カテゴ
リーⅠ)社説が、まだ数百編全集未収録と
なっている!
12 社説起草者推定の流れ
13 この方式のメリット
①
従来まで人手によって検索していた語彙や文体
の類似性がグーグル検索によって自動化される
②
判定作業の進捗状況が、公開の場でなされるこ
とになり、恣意性が排除される
③
社説のテキスト化が必須であるため、別の方式
による判定の方法への応用が可能
14 この方式のデメリット
①
テキスト化のための経費の問題
②
いずれをテキスト化するかの選択が研究代表者に
よって判断される
③
判定が研究代表者・任意の参加者によって食い違
う場合がある
①については、科研費を申請中
②については、現行版1500編を除く4500編をすべて
テキスト化するのは不可能
③については、草稿がない以上判定相違は不可避
ご清聴ありがとうございました
質問1
安川寿之輔は、どのような方向から平山説を批
判しているのか?
質問2
4「プロジェクトの説明」について。グーグル
検索で用語の一致を調べる場合、社説記者が起
草しているが福沢が立案しているものの扱いは
どうなるのか?
質問3
4「プロジェクトの説明」について。11「画像
ファイルに加えてテキストファイル化も進める
=検索が可能となる」の①には、「なるべく多
くの全集未収録社説をテキスト化する」とある
が、誰が選択するのか?
質問4
グーグルのサイト内検索を用いるとしても、検
索語として選ばれる文体的な特徴自体は判定者
が選別するのだから、恣意性は免れないのでは
ないか?