GUM改定の現状について GUM改定の現状について

GUM改定の現状について
─ 技術的側面から ─
計量標準総合センター
榎原研正・城野克広
National Institute of Advanced Industrial Science and Technology (AIST)
1
概要
1. GUM改定の経緯
2. 改定案に対するコメントと収集結果
3. 改定案の概要と位置づけ
4. 改定案の適用例 ー ブロックゲージ測定
National Institute of Advanced Industrial Science and Technology (AIST)
2
経緯
 GUM ・・・ 内容は20年以上変わっていない
 1993 GUM 第1版
 1995 微修正
 2008 JCGM 100 (追加微修正, WEB上でオープン化)
 統計学の立場から,GUMへの批判がある
・・・ 「確率」の扱いに混乱がある(タイプA/タイプB評価で確率概念
が異なる) [例えば L. J. Gleser (1998)]
 混乱を解消する幾つかの提案がある
・・・ いずれもベイズ統計の利用による
Jones (2003)]
[例えば R. Kacker & A.
National Institute of Advanced Industrial Science and Technology (AIST)
3
GUM改定に向けた動き
 主体: JCGM-WG1
JCGM = Joint Committee for Guides in Metrology (国際度量衡局に事務
局をおく国際委員会; ISO, IEC, ILAC等を含む8国際機関がメンバー機関)
 改定の動機
現行GUMには
 内部的不整合がある(Type AとType Bで確率の意味が異なる)
 外部的不整合がある(GUMと、GUM補完文書やVIM3が不整合)
 基本方針
 ベイズ統計の採用により、これらの不整合を解消する
 内容の難易度を維持する
National Institute of Advanced Industrial Science and Technology (AIST)
4
GUM改定に向けた動き
周辺文書へのベイズ統計の(部分的)導入




2007:
2008:
2011:
2012:
VIM(国際計量基本用語集)第3版
GUM補完文書1 (モンテカルロ法を用いた分布の伝播)
GUM補完文書2 (出力量が複数ある場合への拡張)
JCGM 106(適合性評価における測定不確かさの役割)
解説論文等による事前説明
 2008: “How to revise the GUM?” (W. Bich)
 2012: “Revision of the Guide to the Expression of
Uncertainty in Measurement” (W. Bich他)
National Institute of Advanced Industrial Science and Technology (AIST)
5
GUM改定に向けた動き
事前アンケート調査
 2012年実施, 改定の必要性, ベイズ統計利用の是非など
 回答の集計・解析がBIPMホームページで公開されている
 ベイズ統計を導入したGUM改定方針について概ね賛同を得た,と結
論づけられた
改定案作成
• 2014/12月
 JCGM 100 201x CD
・・・ 本体
 JCGM 110 201x CD
・・・ 事例集
(CD = Committee Draft; 公開資料ではない)
改定案コメント収集
• 対象: JCGMメンバー機関(MOs) + 国家計量標準機関(NMIs)
• 2014/12月- 2015/4月
National Institute of Advanced Industrial Science and Technology (AIST)
6
GUM改定案に対するコメントの集計
C. Michotte, BIPM Workshop (2015/6月) 資料
(www.bipm.org/en/conference-centre/bipm-workshops/measurement-uncertainty/)
JCGM Member機関
国家計量標準機関
合計
本体
事例集
905
168
1073
・・・ 改定に否定的な意見が優勢であった
National Institute of Advanced Industrial Science and Technology (AIST)
7
GUM改定案に対する代表的な意見
C. Michotte資料 (BIPM Workshop)の抜粋等
否定的意見
•
•
•
•
•
•
改定のメリットが明瞭でない
改定に伴う社会的コストが大きすぎる
内容がむつかしい
ベイズ統計の適用が中途半端
GUMが利用できる対象が現行より狭くなっている
先験的分布の妥当性の議論をしないまま,そのあとの論理だけを
精緻化しようとしている
• 「不確かさは,測定誤差の大きさの尺度」とのもっともな期待から離
反している
• ・・・
National Institute of Advanced Industrial Science and Technology (AIST)
8
GUM改定案に対する代表的な意見
肯定的意見
•
•
•
•
•
タイプAとタイプBの間の概念上の整合性が向上
知識の状態を適切に表現できる
改定案のほうが理解しやすい
有効自由度の計算が不要になる
適用可能対象分野が広くなる
National Institute of Advanced Industrial Science and Technology (AIST)
9
国内でのコメント回答作業
NMIJ/AIST (作業グループを組織)
(指名)計量 CERI
標準機関 JEMIC
NICT
(不確かさクラブ)
認定機関
標準化
機関
•
•
•
•
•
•
•
BIPM
ILAC
NITE
JAB
JCGM
ISO
JISC
IEC
NMIJ/AIST: 産業技術総合研究所 計量標準総合センター
CERI: 化学物質評価研究機構
JEMIC: 日本電気計器検定所
NICT: 情報通信研究機構
NITE: 製品評価技術基盤機構
JAB: 日本適合性認定協会
JISC: 日本工業標準調査会
• BIPM: 国際度量衡局
• ILAC: 国際試験所認定協力機構
National Institute of Advanced Industrial Science and Technology (AIST)
10
NMIJ/AISTからのコメント (冒頭のみ抜粋)
不確かさ評価のより良いガイドを作成しようとするJCGM WG1の努⼒に感謝します。改定案が、
現⾏GUMに⽐べて統計的により⾼い整合性を持っていることに同意します。⼀⽅、現⾏GUMは、
その発⾏後20年以上経過したいま、トレーサビリティ制度や試験所認定、⼯業規格など多くの
社会的制度の中に組み込まれてしまっていることを考慮する必要があります。そのため、純粋にアカ
デミックな観点から急いで改定を⾏うことが、社会的に望ましくない影響を与え得ることについて深刻
な懸念をもっています。このような制度の再構築に必要となるコストと労⼒に対して⼗分の配慮をせ
ずに改定を進めれば、ここれまでに構築されてきた「不確かさ」に対する社会的信頼性が失われ、
不確かさのより⼀層の普及を阻害する可能性があります。
我々はさらに、改定ガイドが現⾏GUMが適⽤されてきたすべての局⾯をカバーできていない可能
性に懸念をもっています。すなわち分散分析の利⽤、3より少ない繰り返し数でのタイプA評価、及
び定義上の不確かさの取り込みです。もし今までの⽅法ならば適⽤できた状況に、新しい⽅法が
適⽤できないということがあれば、GUMユーザの間で、深刻な混乱、新しい⽅法に対する失望が⽣
じるに違いありません。
従って、私たちは現⾏GUMは当⾯は改定するべきではないと考えます。その代わりに、改定案を
何らかの別の形での⽂書、例えば補完⽂書の⼀つ、として出版するべきです。このようにすることによ
り、新しい⽅法を使うことを望む⼈々には、その機会を提供しつつ、GUMの改定が現在の社会的
制度に及ぼし得る影響を⼗分の時間をかけて調査することができます。現⾏GUMを改定案で置き
換えるべきかどうか、またそれをいつそれを⾏うかについての決定は、このような調査の結果に基づい
て慎重に⾏うべきです。
GUM改定の現状
 改定案(2014/12)についての関係機関の意見は,改定に否
定的であった。そのため,短い期間中に改定される可能性は
低くなったと考えられる
 ただし,GUM内部での確率概念の不統一と,GUM周辺文
書との不整合の問題はなお残っている
 今後,
• 現行GUMと改定GUMを一定期間共存させるなど,改定を受け入れ
やすくする仕組みの検討
• 改定のメリット・根拠についての説明にかかわる広報活動
• コメントで指摘された技術的問題点についての検討
などが進められる可能性がある 今後の詳細については,特別講
演資料(今井秀孝様)参照のこと
National Institute of Advanced Industrial Science and Technology (AIST)
12
GUM改定案概要 ─ 評価手続き上の変更点
 タイプA評価 (繰り返し数 n)
現行
s
n
改定案
(ベイズ統計を利用)
n 1 s
n3 n
(大きくなる)
 タイプB評価 ・・・ (多くの場合)現行と同じ
 不確かさ伝播則
・・・ 現行と同じ
 拡張不確かさ (包含区間)
現行
t 分布表を利用
(多くの場合k≒2 )
改定案
• 複数の方法を提示
• 最も丁寧には Monte Carlo法により分
布形状を評価(GUM補完文書1)
National Institute of Advanced Industrial Science and Technology (AIST)
13
GUM改定案概要 ─ 概念上の変更点
ベイズ統計の(部分的)利用
(有効)自由度の概念は消滅
用語の定義から、タイプA評価、タイプB評価、拡張不確
かさなどを削除 (±拡張不確かさ → 包含区間)
[これらの用語をなくす意図ではない。重要度が下がった]
National Institute of Advanced Industrial Science and Technology (AIST)
14
ベイズ統計とは
1. ベイズの定理を(必ず)用いる
2. 確率の概念を広く捉える
(→ 「知識の状態」を表す)
National Institute of Advanced Industrial Science and Technology (AIST)
15
確率概念の違い
頻度主義
ベイズ統計
(伝統的統計学)
p(  )
p (x)
知識の状態 (State of
knowledge)を表す
ある測定値が得られ
る相対頻度を表す
[分布の拡がりはラ
ンダムネスに起因]
x

測定量の真値
(不可知)
現行GUM
改定案
[分布の拡がりは知識
の曖昧さに起因]
タイプA
x
測定値
測定値

測定量
の真値
タイプB
タイプA & タイプB
National Institute of Advanced Industrial Science and Technology (AIST)
16
「自由度」の扱いの違い
現行GUM
 uc(y) の有効自由度 = 「不確かさの不確かさ」の指標; 包含係数の計
算の基礎
 有効自由度を算定するため,タイプB不確かさの自由度,WelchSatterthwaite近似などを導入した
改定案
 (不確かさの不確かさとしての) 自由度の概念は現れない
 手持ちの情報はすべて確率分布として表現され、情報の曖昧さは、確
率分布自体に盛り込まれる
 ただし、t 分布を特徴付ける単なるパラメータとしては現れることがある
National Institute of Advanced Industrial Science and Technology (AIST)
17
Monte Carlo法による分布の伝播について
 改定案では,合成後の確率分布の形状のチェックのため,Monte
Carlo法を使うこととされている
 GUM補完文書1で詳細に説明されている
 ベイズ的確率概念がベース
 NIST(米国標準技術研究所)における不確かさ評価の新ガイド*) にお
いても広範囲に利用されている
 簡単に利用できるソフトウエアが利用可能になってきた (例えば,NIST
Uncertainty Machine [http://uncertainty.nist.gov/] )
*) A. Possolo, NIST Technical Note 1900, Simple Guide for Evaluating
and Expressing the Uncertainty of NIST Measurement Results (2015).
[ただし本ガイドは,NISTで従来から用いられている NIST Technical Note 1297 を
置き換える趣旨でないとされている]
National Institute of Advanced Industrial Science and Technology (AIST)
18
不確かさの伝播 vs 分布の伝播
(図はGUM補完文書1による)
不確かさの(分散
の)伝播
• 不確かさ伝播則
• 偏微分必要
• Monte Carlo法
• 乱数発生必要
分布の伝播
National Institute of Advanced Industrial Science and Technology (AIST)
19
確率概念
改定案の「ベイズらしさ」のレベル
頻度主義統計
現行GUM
GUM改定案
• タイプA評価だけのGUM
• 全体の論理は頻度主義
• タイプB評価に主観確率を導入
・・・・・・ 折衷
• タイプA評価をベイズ化
• 確率分布 p(y)の計算は必須でない
GUM Supplement1
ベイズ統計
・・・・・・ 頻度基準
• 骨格はベイズ統計
• 確率分布の計算はベイズ定
理の代わりに「分布の伝播則」
・・・知識の
状態
• Full Bayes = 観測方程式 + ベイズ定理+周辺化
National Institute of Advanced Industrial Science and Technology (AIST)
20
どう位置づけられるか?
統計学
頻度主義
GUM
(GUM以前の)
Metrology
(計量学)
改定案
ベイズ
National Institute of Advanced Industrial Science and Technology (AIST)
21
ブロックゲージ測定への適用例
d = D + d1 + d2 = L(1 + ) − Ls (1 + ss)
標準(
添え字s)
熱
膨
張
係
数

比較器の出力(D) 比較器の校正証明書には、
偶然成分(d1)と系統成分(d2)
の不確かさが別に報告。
(20 + ) ºCにおける
長さ:L(1+)
ただし、ユーザーにとっ
ては、いずれも系統成
分である。
22
L =
Ls + (D + d1 + d2) − Ls ((0+) + s) − Lnom
L: 測定対象のブロックゲージとその公称値との差(nm)
Ls : 標準のブロックゲージの長さ(nm)
Lnom: ブロックゲージの公称値(= 50 mm)
D: 比較器の出力の5回繰り返しの平均値(nm)
d1, d2: 比較器の校正証明書に書かれた校正値の不確かさの偶
然成分と系統成分(nm)
(0+), :測定対象のブロックゲージの温度の20 ºCからのず
れおよび標準のブロックゲージの温度からのずれ(ºC )。前ス
ライドのは(0+)。
 との違いの詳しい記載はない。
0
s, :測定対象のブロックゲージの熱膨張係数および標準の
ブロックゲージの熱膨張係数との差(ºC−1)
23
Lsの不確かさ
• 標準のブロックゲージの長さGUM:2008にて、
Ls = 50 000 623 nm、Up = 75 nm (k = 3)
と値付けされているものとする。
有効自由度は = 18である。
• 改定GUM案に従い以下のように計算する。
^L = 50 000 623 nm 現GUMでは、もちろん、
U / 3 = 25 nm。
s
Up
18
^
u(Ls) = = 27 nm
3 18 − 2
p
24
Dの不確かさ
• Dは5回繰返して求めた。平均値は215 nm。
ただし、LとLsの比較を25回実施して、プール
された標準偏差13 nmを予め求めてある。
• 改定GUM案に従い以下のように計算する。
^
D = 215 nm
13
^
u(D) = 5
現GUMでは、もちろん、
13/√5 nm。
24 = 6.1 nm
24 − 2
25
の不確かさ
• は± 1 × 10−6 ºC−1という変動幅が与えられ、
その幅自体が10 %までは信頼できる。
• 改定GUM案に従い、以下のように計算する。
^
 = 0 ºC−1
幅が不明瞭な分はこの形で標
準不確かさに入れる。現GUMで
は、有効自由度に考慮する。こ
の式の出所はGUM Supplement 1 (JCGM 101)の6.4.3.2。最大エントロピー法による。
^
−6)2
−6)2
(2 ×
10
(0.1×10
u() =
+
9
12
= 0.58 ×10−6 ºC−1 26
d1の不確かさ
d2の不確かさ
• Lsと同じ手法。
•
•
•
•
sの不確かさ
0の不確かさ
の不確かさ
の不確かさ
sは幅の曖昧さのない矩形分布。( ± 2 × 10 ºC )
0は正規分布。( ~ N(−0.1 ºC, (0.2 ºC) )
は幅の曖昧さのないU字分布。( ± 0.5 ºC)
はと同じ手法。( ± 0.05 ºC、幅の値は50 %まで信頼)
−6
−1
2
27
線形近似による計算
^
不確かさ要因
標準不確かさ
感度係数
標準の校正
27 nm
1
27
繰り返し
6.1 nm
1
6.1
d1 比較器校正の偶
5.0 nm
然成分
1
5.0
d2 系統成分
7.7 nm
1
7.7
熱膨張係数
s
 0 温度の平均
 周期変動
1.2 ×10−6 oC−1
0 nm∙oC
0
0.2 oC
0 nm∙oC−1
0
0.35 oC
0 nm∙oC−1
0


熱膨張係数の差
0.58×10−6 oC−1
5.0×106 nm∙oC
2.9
温度の周期変化
0.030 oC
575 nm∙oC−1
17
記号
Ls
d
D
ui(L) /nm
改定GUM
案では二
次近似は
なし。
ui(^L) = 34
28
モンテカルロ計算
統計計算ソフトRでのプログラム例(関数rTdist、
rUdist, rCtrapは自作のプログラム。最後のス
ライド参照)
n <‐ 1000000
Ls <‐ rTdist(n,50000623,27,18)
D <‐ rTdist(n,215,6.1,24)
d1 <‐ rTdist(n,0,5.0,5)
d2 <‐ rTdist(n,0,7.7,8)
alp_s <‐ runif(n,9.5E‐6,13.5E‐6)
tht_0 <‐ rnorm(n,‐0.1,0.2)
dlt <‐ rUdist(n,‐0.5,0.5)
d_alp <‐ rCtrap(n,‐1E‐6,1E‐6,0.1E‐6)
d_tht <‐ rCtrap(n,‐0.05,0.05,0.025)
Lnom <‐ 50000000
dL <‐ Ls+D+d1+d2‐
Ls*(d_alp*(tht_0+dlt)+alp_s*d_tht)‐Lnom
hist(dL,col=8)
sd(dL)
> sd(dL)
[1] 36.01172
29
現GUM・改定GUM案(線形近似)・改
定GUM案(モンテカルロ法)の比較
• 現GUMでもほぼ同様の例が取り上げられている。
• 現GUMでは、一様分布の幅が不明瞭は効果は標
準不確かさには取り入れない。一方、非線形の効果
を考慮するべく二次の項への言及もある。
• 一様分布の幅が不明瞭な効果は有効自由度の考
え方で拡張不確かさに取り入れる。一方、非線形の
効果は自由度の計算ができない。
標準不
確かさ
現GUM
改定GUM案 改定GUM案
二次近似
線形近似
34 nm
34 nm
モンテカルロ法
36 nm
30
心配されること
• 改定GUM案が導入された場合も、通常の測定で
はモンテカルロ計算は必要ないが、必要性を
チェックをしなくてはいけないかも知れない。
• 線形近似した場合、不確かさは大きくなる。
• 改定GUM案の事前情報の決め方は、複雑な
ケースに適用しようとすると、色々問題があるか
も知れない。
31
スライド9 プログラムで用いた関数
(GUMに記載の内容ではない。)
rCtrap <‐ function(n,a,b,d){
r1 <‐ runif(n)
r2 <‐ runif(n)
as <‐ (a‐d)+2*d*r1
bs <‐ (a+b)‐as
rCtrap <‐ as+(bs‐as)*r2
}
rUdist <‐ function(n,a,b){
r1 <‐ runif(n,‐2*pi,2*pi)
rUdist <‐ (b‐a)/2*sin(r1)+(b+a)/2
}
rTdist <‐ function(n,mx,sd,df0){
rTdist <‐ mx + sd*sqrt((df0‐2)/df0)*rt(n,df = df0)
}
32