スライド 1

プログラミング言語論
第3回
BNF記法について(演習付き)
篠埜 功
構文の記述
プログラミング言語の構文はどのように定式化できるか?
プログラミング言語の特徴: 入れ子構造(nesting)
例1: forループの中にforループが書ける。
for (i=0; i<= 10; i++) {
for (j=0; j<=20; j++) { …
例2: 算術式の中で、(…) の中で、(…)を書ける。
1 + (2 * (3+ 4) )
このような構造は、文脈自由文法で表す。
(正規表現では表すことができない。)
文脈自由文法を表記するためのメタ言語であるBNF記法を
紹介する。
BNF記法
• Backus Normal Form (Backus Naur Form)
• 集合を定義する際の記述法(言語)。集合を
帰納的に定義する。(帰納的定義 inductive
definition)(再帰的定義 recursive definition
ともいう)
• 規則を「非終端記号(non-terminal symbol)」
と「終端記号(terminal symbol)」で表す。
• 文脈自由文法(context free grammar)の構文
規則を記述する際に用いられる。
– 構文規則=文を構成するための規則
非終端記号と終端記号
• 非終端記号(non-terminal symbol)
– 非終端記号または終端記号からなる列に展開さ
れる。<>で囲む。
• 終端記号(terminal symbol)
– 文字列、数値、= など それ以上他の要素の組み
合わせで置き換えることができないもの
– ’ ’等で囲んで表すこともある。
BNF記法による規則の書き方(BNF記
法の定義)
非終端記号 (1つ)のあとに ::= を書き、その後に非終端記号ま
たは終端記号からなる列を縦棒 | で区切って並べたもの(縦棒
はなくてもよいし、2つ以上あってもよい)
が一つの規則であり、それを並べて書く。
(BNF記法の例および意味)
<不等式> ::= <式><不等号記号><式>
<不等号記号> ::= ’>’ | ’<’
can be
or
BNF記法の意味
• 非終端記号は集合に対応
– 非終端記号は、それに対応する集合の任意の要素を表
していると見てもよい。
– この見方では、複数回表れる同じ名前の非終端記号は
一般に別の要素を表す。
• 同じ名前の終端記号は同じものを表す
<式>は、式の集合に対応する。
(式の集合中の任意の要素を表すと見てもよい)
<不等式> ::= <式><不等号記号><式>
<不等号記号> ::= ’>’ | ’<’
BNF記法の意味
• 複数の選択候補がある場合は「|」を使って表現
<不等号記号> ::= ’>’ | ’<’
can be
or
「不等号記号は’>’または ’<’である」
• 再帰的定義 recursive definition(帰納的定義
inductive definition)
<文章> ::= <文> | <文> <文章>
「文章は文あるいは、文と文章が並んだものある」
構文木
<式> ::= <数字><論理記号><数字><等号><数字>
<数字> ::= ‘0’ | ‘1’
<論理記号> ::= ‘and’ | ‘or’
<等号> ::= ‘=’
(例) 1or0=1 の構文木
非終端記号
<式>
<数字>
<論理記号>
<数字>
<等号>
<数字>
‘1’
‘or’
‘0’
‘=’
‘1’
終端記号
拡張BNF記法(extended BNF)(1)
• BNF記法を読みやすいように拡張
– 次の式は「文章は一つ以上の文で構成される」と
いうことを再帰的に表現
<文章> ::= <文> | <文> <文章>
– これをもっと簡潔に書きたい
<文章> ::= <文>+
+は1つ以上の繰り返しを表す
拡張BNF記法(2)
• A | B は、AまたはB。
• {A}は、Aの0回以上の繰り返しを表す。
– (例) {ab}は、ε, ab, abab, ababab, abababab, …を表す。
• (A)は、Aをひとまとめにする。
– (例) (a|b)c は、acまたはbcを表す。
• [A] は、Aまたは空を表す。(例) [a]は、εまたはaを表す。
• (A)+ は、Aの1回以上の繰り返しを表す。
• (A)* は、Aの0回以上の繰り返しを表す。({A}と同じ)
– (例) a+ は、a, aa, aaa, aaaa, ….を表す。 aa*と同じ。
【参考】Chomskyの言語階層
Noam Chomskyの言語階層
Type 0 制限なし
Type 1 文脈依存文法(context sensitive grammar)
Type 2 文脈自由文法(context free grammar)
Type 3 正規文法(regular grammar)
(1年後期 形式言語とオートマトン)
第1問
• ビット列をBNF記法を利用して定義せよ. また
拡張BNF記法で書くとどうなるか.
– 以下の非終端記号を利用せよ
ビット列用の非終端記号 --- <ビット列>
ビット用の非終端記号 --- <ビット>
(ビット列の例)
10010111001011100010100 など。
解答1
• BNF記法
<ビット列> ::= <ビット> | <ビット><ビット列>
<ビット> ::= 0 | 1
• 拡張BNF記法 (例)
<ビット列> ::= (0 | 1)+
ちなみに、空文字列(ε)を含む場合は、
• BNF記法
<ビット列> ::= ε | <ビット><ビット列>
<ビット> ::= 0 | 1
• 拡張BNF記法 (例)
<ビット列> ::= (0 | 1)*
第2問
• aが偶数個(0個は除く)並んだ文字列を
BNF記法、拡張BNF記法で定義せよ。
(例) aa や aaaaaaaa など。
解答2
• BNF記法
<evena> ::= aa | <evena> aa
• 拡張BNF記法
<evena> ::= (aa)+
ちなみに、空文字列を含む場合は、
• BNF記法
<evena> ::= ε | <evena> aa
• 拡張BNF記法
<evena> ::= (aa)*
第3問
• 自然数リストは、( )であるか、あるいは自
然数リストと自然数を(自然数 . 自然数リス
ト) のようにしてペアにしたものであるとす
る。これをBNF記法で表せ。ただし自然数
は<nat>で既に定義されているものとする。
(例)
(2 . (30 . (5 . ( ) ) ) ) など。
解答3
• BNF記法
<natList> ::= ( )
| ( <nat> . <natList> )
第4問
• 対応のとれた括弧からなる文字列をBNF
記法で定義せよ。
(例)
() や ()(()) など。
解答4
• BNF記法
<paren> ::= ( )
| ( <paren> )
| <paren><paren>
空文字列εを含む場合は、
<paren> ::= ε
| ( <paren> )
| <paren><paren>
第5問
• 対応のとれた括弧で、3段階以上のネスト
は許さないような文字列をBNF記法で記述
せよ。
(), (()), ()(), ()(()), ……
()((())) など、ネストが3段階以上のものは
除く。
解答5
• BNF記法
<paren> ::= <paren1>
| ( <paren1> )
| <paren> <paren>
<paren1> ::= ( ) | <paren1> <paren1>
空文字列εを許す場合は、
<paren> ::= ε | <paren1>
| ( <paren1> ) | <paren> <paren>
第6問
• 問5の文字列は正規表現で記述できるか。
解答6
できる。
{ ( {( )}* ) } +
空文字列を含む場合
{ ( {( )}* ) } *
(注) ここでは、{ }を、正規表現における括弧として
用いた。
構文図式
(syntax graphあるいはsyntax diagram)
文脈自由文法の構文規則を表す際に用いられる
graphicalな言語
(さきほどの例) <数字> ::= ’0’ | ’1’
<式> ::= <数字> (’and’ | ’or’) <数字> ’=’ <数字>
数字
1
0
式
数字
and
or
数字
=
数字
構文図式
終端記号 x
x
非終端記号 <A>
A
繰り返し {α}
αの図式
構文図式
並び α1 α2 … αn
α1の図式
α2の図式
選択 α1 | α2 | … | αn
α1の図式
α2の図式
…
αnの図式
…
αnの図式
第7問
• 次の構成図が与えられたとき,この構成図で表現できる
文字列として正しいものを①~⑤から全て選べ.ただし,
英字はa, b, ・・・,z, A, B, ・・・,Zのいずれか,数字は0,
1,・・・,9のいずれかであるとする.
① A3 ② BB ③ A# ④ #9 ⑤ 99
英字
‘#’
数字
第8問
• あるプログラミング言語で使える変数名は,次の構文図
で規定されているものとする。このとき,変数名として使
えないものを選べ。ただし,英字はa, b , ・・・, z,A, B, ・・・,
Zのどれか,数字は0, 1, ・・・, 9のどれかである。
①A
② name
③ B740
④ C6H6
数字
英字
英字
⑤ 11PM
補足: 文法とは(1)
• 文法とは、 (N, T, P, S)
N は記号の有限集合。非終端記号(nonterminal
symbol)と呼ぶ。
T はNとは重なりのない記号の有限集合。終端記号
(terminal symbol)と呼ぶ。
Pは、(N  T)* N (N  T)*  (N  T)*の有限部分集
合。生成規則(production)あるいは書き換え規則
(rewriting rule)と呼ぶ。
SはNの要素で、開始記号(start symbol)と呼ぶ。
補足: 文法とは(2)
u  v が生成規則で、uが文字列の部分文字列で
あるとき(  =  u  となる  ,   (N  T)* が存在)、
文字列の中のuをvに書き換えてよい( ’ =  v 
が得られる)。
これを   ’ と書く。
{ x  T* | S * x } が、 (N, T, P, S) によって生成される
言語。