タグの定義(5)

レポート
• 今日(5・2)作成した任意の新聞記事1記事 + もう1記事
計2記事のタグ付けを行う. 記事のファイル名は
1つ目は99999901.txt 2つ目は99999902.txt とする
(ただし,999999の部分は学生番号)
• 提出期限:5月15日まで
• 提出方法:電子メールに添付
宛先:[email protected]
件名:コーパス言語学入門レポート1
レポートは,添付ファイルとしてつける
本文:作業内容の簡単な説明を書く.また,新しくタグを
定義した場合は,その説明も書く
タグの定義(5)-抜粋
1. 素材の管理のための情報
<pubdate>作成日</pubdate>
<author>著者</author>
<tagdate>加工日</tagdata>
<tagger>加工者</tagger>
<tagger_id>加工者のID(学籍番号)</tagger_id>
タグの定義(8)-抜粋
3. コンピュータでの処理をしやすくする+
言語研究での利用をしやすくするための情報
テキスト構造に関する情報
<article>記事全体</article>
<title>見出し</title>
<date>日付</date>
<sent>文</sent>
<para>段落</para>
<text>テキスト</text>
タグの定義(9)-抜粋
3. コンピュータでの処理をしやすくする+
言語研究での利用をしやすくするための情報
単語の品詞情報(自立語だけ)
<noun>名詞</noun>
<verb>動詞</verb>
<adj>形容詞</adj>
<adv>副詞</adv>
タグの定義(10)-抜粋
3. コンピュータでの処理をしやすくする+
言語研究での利用をしやすくするための情報
固有名などの情報(名詞の属性として)
名詞 <noun></noun>
<noun ne=“loc”>場所</noun>
<noun ne=“org”>組織名</noun>
<noun ne=“num”>数値</noun>
<noun ne=“time”>時間</noun>
<noun ne=“person”>人名</noun>
<noun ne=“title”>役職</noun>
その他
• タグの定義に不足を感じたら...
(必要なものがでてきたら)
– 各自,自分で定義.
– どのようなものを新たに定義したかを明示
• レポート提出する電子メールの本文に記すこと