6.2.4 辞書項目

6.2.4 辞書項目(1)
辞書項目にも、語に対するDAGを与える。
cat :
Uther  1
sleeps  3
sleep  5
NP
head : 2 agreement : num ber: sin gular
 person: third



cat :
V
head : 4
form :
finite
subject: agreement :num ber: sin gular
 person: third



cat :
V
head : 6
form : finite
subject: [agreement: [number: plural]]
素性標識catに対する素性値NPおよびVは、語の範疇、すなわち、語標識を表す。
6.2.4 辞書項目(2)
Sleepsとsleepのそれぞれと文法規則ET2をユニフィケーションすると、ET2はVPのヘッ
ド素性値とVのヘッド素性値が等しいことを表しているので、次のようになる。
cat : VP 
sleeps  7 

head: 4 
ET1)
S  NP VP
S ( head )  VP ( head )
S ( head subject )  NP( head )
cat : VP 
sleep  8

head : 6 
ET2)
VP  V
VP ( head )  V ( head )
文法規則ET1とET2、および上の辞書から
cat :
Uther sleeps 
S
head : 1 form :
subject: 2
finite
agreement : num ber: sin gular
 person: third



cat : NP
Uther 

head: 2 
cat : VP 
sleeps  

head : 1 
のようにユニフィケーションが成功する。
6.2.4 辞書項目(3)
その結果、
Uther sleeps.
が文法にかなう文であることが結論される。
しかし、
*Uther sleep.
に対しては、number素性の素性値がpluralとsingularで非両立となり、ユニフィケーション
が失敗し、文法にかなわない文であることが示される。
6.2.5 下位範疇化(1)
動詞の後に何もこない形である文法規則ET2に対して、動詞の後に動詞補語を取る
形の文法規則を示す。
動詞に対してこの動詞の補語の部分を動詞後位置の下位範疇化フレームという。
動詞がこの動詞後位置の下位範疇化フレームに対して置く制約を、
その動詞によるその動詞後位置の下位範疇化フレームに対する語彙的選択という。
以下にその規則の例を示す。
ET3)
VP  V NP
VP ( head )  V( head )
V( subject )  np
ET4)
VP1  V NP VP 2
VP1( head )  V( head )
VP 2( head form )  inf initival
V( subcat )  npinf
Subcat素性により、
ET3ではVがnpに関して下位範疇化することを、
ET4ではVがnpとinfに関して下位範疇化することを示している。
ET4の第2行はVP2が不定詞の形をとることを示している。
6.2.5 下位範疇化(2)
以下にそれぞれの規則に対する動詞の語彙項目の例を以下に示す。
cat : V
head: form: finite
subcat : first:
rest:
storms 
[cat : NP]
cat : NP
first:
head : agreement : number : sin gular
person: third
rest : end
first,rest
end
動詞を下位範疇化する補語をバイナリの埋め込み形式で指定する。
動詞後位置の補語を左から順番に書き最後に動詞前の補語を書く。
終了を示す
[cat:V]:stormsの構文範疇が動詞であることを示す。
[head:[form:finite]]:stormsが定型の形で現れることを示す。
[first:[cat:NP]]:動詞後位置の第一補語の構文範疇が名詞であることを示す。
<subcat rest>:残りの補語の素性を記述している。
6.2.5 下位範疇化(3)
cat : V
head: [form: finite]
subcat : first : cat : NP]
rest :
persuades 
first :
cat : NP
head: [form: inf initival]
subcat : [rest : end]
rest : first : cat : NP
head :
agreement :
number : sin gular
person: third
rest : end
Subcat素性はその素性値として、目的語である名詞句、その後に続く不定形の動詞句、
及び、主語である名詞句を表している。
不定形の動詞句は、そのsubcat素性値がendであることから、その動詞に対しての動
詞後位置の補語は取らないし、主語も消失している。
6.2.5 下位範疇化(4)
動詞句に補語をくっつけていくときには、その動詞句のDAGが持つ補語のためのス
ロットに補語のDAGをユニファイする。
VP1  VP 2 NP
VP1( head )  VP 2( head )
VP 2( subcat first )  NP
VP 2( subcat rest )  VP1( subcat )
ユニフィケーションが行われるには、VP1とVP2のヘッドはそれぞれ素性を共有し、NP
はVP2の下位範疇化フレームの最初のスロットとユニファイされ、VP1の下位範疇化フ
レームはVP2の下位範疇化フレームから最初の要素を取り去ったものであるという条
件を満たさなければならない。
その他の規則として次のようなものがある。
VP1  VP 2 VP 3
VP1( head )  VP 2( head )
VP 2( subcat first )  VP 3
VP 2( subcat rest )  VP1( subcat )
6.2.5 下位範疇化(5)
VP  V
VP ( head )  V( head )
VP ( subcat )  V ( subcat )
S  NP VP
S( head )  VP ( head )
S( head form )  finite
VP ( subcat )  NP
VP ( subcat rest )  end
次の規則は動詞後位置の補語の種類を特定しない一般的なものである。
VP1  VP 2 X
VP1( head )  VP 2( head )
VP 2( subcat )  X
VP 2( subcat )  VP1( subcat )
6.2.6 論理形(1)
意味を扱うために、述語を表す素性predと、I番目の変項を表すargiを用いて論理形を
定義する。
pred: st orm 
arg1 : ut her 


arg 2 : cornwall
Uther storms Cornwall
Uther persuades Arthur to sleep
pred: persuade

arg1 : ut her



arg 2 : art hur



arg 3 : zred : sleep  
arg1 : art hur 




このような論理表現は、DAGの<head trans>の値で表される。
例)Uthurの語彙項目が、uther(<head trans>)により表される
cat : NP
Uther 
head :
agreement :
number : sin gular
person: third
trans :
uther
6.2.6 論理形(2)
動詞stormsの語彙項目は、以下のstorms(<head trans>)により表される。
cat :
head
V
form :
Trans
:
storms 
finite]
 pred : st orm
arg1 : 2[] 


arg 2 : 1[] 
subcat : first : cat : NP

head: [ trans: 1]


rest :
cat :
cat :
head :
rest :
end
NP
agreement : number: sin gular 
person: third



trans :
2
6.2.7 解析(1)
PATR-Ⅱシステム
ZPATR、DPATR、CPATR
ZPATRの解析・・・ Early(p42-p60参照)のアルゴリズムにおける予測部分解析木の作
成法を拡張したもの
Earleyのアルゴリズム
構成素の先頭の語の範疇を予測するために、その構成素を
句構造規則を使って展開し、予測部分解析木を作成。
PATR-Ⅱ解析
構成素の先頭の語に対するDAGを予測する。この際、トップダウン予測
課程でフィルタとして働く限定子を使う。
予測されるDAGはこの限定子により限定されたものとなる。
限定予測解析法
予測の過程で素性をフィルタとして使うことにより、作成する部
分解析木の数を少なくでき、確定部分解析木に選定されない無
駄な予測部分解析木の作成をかなり回避できる。
6.2.7 解析(2)
(1)限定DAG
元のDAGの限定DAG
DAGの限定:DAGのドメインを限定すること
Φ:パスと素性標識の関係
↑:関係ΦをDAGに作用させる関数子
関数子↑の作用の定義
DAG↑Φは以下の条件を満たす最小な限定DAG
最小な限定DAGをDAG´と表すと、すべてのパスpに対して、DAG´が定義されない
DAG´は原子項である
 l  Dom( DAG( p)) なるすべてのlに対してpΦlである
限定子により特別に許されるものである
DAGの限定
限定されたDAG´と元のDAGの間には、
DAGDAG
の関係がある。
従って、DAG↑Φは、限定されたDAGの中で最小なものである。
6.2.7 解析(3)
限定子の単純な例として、パスの集合から作られる限定子を使う。
DAGの例)
a: [b:c]
D=
d: e:l[f:[g:h]]
i:[j:l]
k:l
パスの集合を次のものにする。
{<a, b>, <d, e, f>, <d, i, j, f>}
すべてのパスおよびそれらすべてのプリフィックスに対して、pΦlであるようなΦを限定子
とすると、次のようになる。
a: [b:c]
D↑Φ =
d: e:l[f:[]]
i:[j:l]
6.2.7 解析(4)
(2)アイテム
限定予測解析法でのアイテムの表し方
[h, i, dotted-rule, D]
上記のアイテムと、Earlyのアルゴリズムを使ったアイテムとの関係の表し方
I h  ([dotted-rule, i])
h:パーステーブルの番号
i:時点ポインタ
D:新しく追加したもの。 DAG を表す。
予測過程でフィルタとして働く素性集合
6.2.7 解析(5)
(3)解析アルゴリズム
解析は次のアイテムから開始する。
[0,0, X 0   , D], D X 0 cat   S
素性Sを持つ標識を左辺に持つPATR‐Ⅱ規則から始めることを示す。
解析アルゴリズムのステップ
予測ステップ
アイテム [ f , i, X 0    X j  , D] とPATR-Ⅱ規則 [ X 0   , E ] のすべての組み合わせ
に対して、[i, i, X 0   , E  (D( X j )  )] を作る。
但し、ユニフィケーションが可能であり、かつ新しいアイテムが既存のアイテムに包摂
されないとする。
ここで、一つのアイテムが他のアイテムに包摂するとは、アイテムの最初の三つの要
素がそれぞれ等しく、4番目の要素について包摂が成り立つことである。
完了ステップ
[h, i, X 0   , D] と [ g, h, X 0    X j , E] のすべての組み合わせに対して、
[ g, i, X 0    X j , E  [ X j : D( X 0)]] を作る。
但し、ユニフィケーションが可能であり、かつ新しいアイテムが既存のアイテムに包摂
されないとする。
6.2.7 解析(6)
探索ステップ
i  0 であり、処理する語がaであるとき、すべての [h, i  1, X 0    a , D]に対して、
[h, i, X 0  a   , D] を作成する。
ここで、予測ステップは、Earlyのアルゴリズムにおける予測部分解析木の作成に
相当し、探索ステップと完了ステップは、合わせて、確定部分解析木の選択に
相当する。
6.2.7 解析(7)
(4)解析例
例文ES(p16参照)
He sees yellow tables in the room
の解析において、PATR-Ⅱ文法規則における文脈自由型規則以外に必要な
最低限の文法機能は、人称、数、時制である。
よって、
句構造規則ER(p10参照)に対応するPATR-Ⅱ文法規則は、PATR-Ⅱ
文法規則ET、及び他の句構造規則ERから同様に作成できるPATR-Ⅱ文
法規則で表される。
例文ESに表れる語に対する辞書項目も、 PATR-Ⅱ文法規則に対応し
て表される。
6.2.7 解析(8)
例文ESでは、解析過程で限定DAGを使う効果があまりない。
限定DAGとして、人称、数、時制を排除するものを使用する
句構造規則ERを使うEarly法の解析と同一になり、Early法で解析したのと同じく
1Sから9S(p17-19参照)までの9個の解析木が求まる。
限定DAGを使わない
句構造規則ERに人称、数、時制に関する文法的制約を入れた解析になるが、解
析木1Sから9Sはすべてこの文法的制約を満たすので、1Sから9Sまでの解析木が
求まる。