学習エージェントシミュレーションで探る環境配慮型社

学習シミュレーションで探る
環境配慮型社会:
エージェントベースアプローチ
在間敬子
専修大学商学部
[email protected]
[email protected]
研究の背景
90年代 環境配慮行動の広まり
グリーンコンシューマリズム
増えてきている
グリーンマーケティング
環境情報提供
の役割が指摘されている
Afsah, Laplante & Wheeler (1996) Tietenberg (1998)
環境認証
環境ラベル
環境マネジメントシステム
環境報告書など
「環境政策の第3の波」
個々の意思決定主体の自発的な
環境配慮行動を促進する仕組み
第1の波 直接規制
第2の波 経済的手法
研究の背景
• 情報提供
自発的な対策を促進するものと期待
↑
企業の活動や製品の環境情報
‥消費者・投資家に判断材料
‥企業に影響
研究の背景
自発性が求められる理由
• 直接規制・経済的手法とも
誰に、どれだけ、対策を施すかを決める必要
• 地球環境問題の「不確実性」
科学的根拠など不確実だが、何らかの対策必要
ということはわかっている
• 政策の意思決定を待っていたのでは手遅れの可
能性
研究の背景
環境配慮行動進んでいるようだが、
環境配慮型製品の普及あまり進んでいない
環境によい商品への意識高くても
・買いたくても 買えない
例) 古紙含有率高い大学ノート など
・売りたくても 売れない
例) S社 計測機器 環境配慮への要求少ない
ある種のジレンマ問題
在間(2002)
本報告の目的
・環境配慮型製品の選択のジレンマ問題
を捉えるモデル
・ジレンマを解消するデザイン
環境情報提供の役割
エージェントベースアプローチ
プレゼンテーション目次
1 ジレンマ問題と環境情報提供
2 分析課題
3 モデル
4 シミュレーション結果
5 今後の課題
ジレンマ問題
環境配慮に関する態度と行動
タイプ
環境配慮型
非環境配慮型
名称
グリーン
態度
より環境に配慮したい
現状のままでよい
行動
環境配慮製品を選択する
従来の製品を選択する
ノーマル
ジレンマ問題
態度と行動
エージェント
エージェント
態度
グリーン
ノーマル
行動
グリーン
ノーマル
(a) 態度と行動の一致
エージェント
エージェント
態度
グリーン
ノーマル
行動
ノーマル
グリーン
(b) 態度と行動の不一致
ジレンマ問題
相手のクラスのエージェント
グリーン
エージェント
ノーマル
グリーン
ノーマル
ノーマル
ノーマル
ノーマル
ノーマル
ノーマル
ノーマル
ノーマル
ノーマル
態度と行動の不一致を余儀なくさ
れるエージェントが両クラスに多
数存在
しだいに両者とも環境配慮をあき
らめてしまう状況
このようなジレンマ状況
を回避する手段としての
環境情報提供
経済理論分析での環境情報
●情報の提供側の問題:ウソをつく
製品の環境配慮
信用(credence)特性
↓
欺瞞情報の問題
↓
第3者認証情報の役割
モニタリングの強化
●情報の受け手側の問題:間違える
経済理論では
正しい情報収集 → 正しく行動
学習
財の特性
探索財 服のデザイン
経験財 ツナ缶の味
信用財 「生分解性」
現実の意思決定
プロセスは複雑
分析課題:情報から行動のプロセス
情報
知識獲得
情報に気づき、知識として取り込むプロセス
意識
得た知識から、意識(態度)を形成するプロセス
行動
態度を行動に反映させるプロセス
分析課題:ダイナミクス
環境情報提供に期待される役割
① 企業をとりまく意思決定主体の環境配慮行動を促進
↓
② ミクロな意思決定主体間の相互作用
↓
③ 間接的に企業の環境配慮行動を促進
↓
④ マクロな環境配慮型社会への移行
社会変容のダイナミクス
これまでの環境情報提供の分析では扱われていない
概念モデル:学習エージェント
エージェント
外部環境
目標
コミュニティ
他のエージェント
外部環境の
主観的認識像
情報
知識
政府
レベル変数の
調整器
態度変容ルール
環境配慮レベル
政策
市場
他のエージェント
<意思決定>
コミュニティ活動・経済活動
エージェントのクラスと数‥消費者n・企業m
多数
概念モデル:エージェント集団の学習
エージェント
エージェント
参照空間
目標
外部環境の
主観的認識像
情報
知識
レベル変数の
調整器
態度変容ルール
エージェント
環境配慮レベル
<意思決定>
コミュニティ活動・経済活動
エージェント
モデル:環境配慮レベル
環境配慮についての意識・態度
程度の差
s  sci (t ), s fj (t )  s
シミュレーションでは0以上5以下の正の整数
シミュレーションの初期設定
すべてのエージェントの環境配慮レベル0
1期 微小な割合の消費者がレベル1に変化
例 80年代初めのグリーンコンシューマの登場
微小な変化に対する変化のダイナミクスを調べる
添え字
c:消費者
f:企業
ci:i番目の消費者
fj:j番目の企業
モデル:エージェントの行動
コミュニティ活動
Aci (t )  f (sci (t ))
環境配慮レベル
s  sci (t ), s fj (t )  s
3
B fj (t )  g (s fj (t ))
f ( s)  g ( s)  0
3のレベルに見
合う環境保全
活動
f’>0、g’>0
経済活動
製品は環境配慮面で差別化
製品の環境配慮
の度合いを選択 s  qci (t ), q fj (t )  s
↓
3を越えないレベル
消費・供給
モデル:製品の環境配慮の度合いの選択
ns ms
●企業
環境配慮レベル
s fj (t )
1
環境配慮レベルがsである消費者数・企業数
ns fj (t )  0  q fj (t)  s fj (t)
ns fj (t )  0  q fj (t ) はs fj (t )
を超えない最大値
n1  0
●消費者
環境配慮レベル
sci (t )
3
→ 1のレベルの製品を供給
msci (t )  0  qci (t )  sci (t )
msci (t )  0  qci (t) はsci (t )
を超えない最大値
m3  0, m2  0, m1  0
→ 1のレベルの製品を消費
モデル:需要量・供給量の決定
●消費者
Max u ci (t )   (qci (t )) xci (t )
xci ( t )
s.t.Eci (t )  p(qci (t ))xci (t )  p A f (sci (t ))
 (qci (t ))
製品の環境配慮についての満足度
xci* (t )  [Eci (t )  p A f (sci (t ))] p(qci (t ))
●企業
 fj (t )  p(q fj (t )) y fj (t )  c(q fj (t ))  pB g (s fj (t ))
*
*
x
(
t
)

y
 ci  fj (t )
i
y *fj (t ) 
j
x
*
ci
i ,qci ( t ) q
(t ) mq
qci (t )  q fj (t )  q
モデル:外部環境から獲得する情報
エージェント
獲得する情報
外部環境
●環境配慮レベルについての
エージェント数(0か正か)
ns (t ), ms (t )
コミュニティ
市場
(s  s  s )
●コミュニティ活動量
の平均値
A (t ), B (t )
●今期と前期の
消費量または供給量
{xci* (t ), xci* (t  1)}or
{ y *fj (t ), y *fj (t  1)}
●市場に供給されている
製品の環境配慮の度合い
広告
環境ラベリング
モデル:環境配慮レベルの調整
環境配慮レベルの調整:2段階認知ルール
認知する情報
●同じクラスのエージェントのコミュニティ活動平均値と自らの活動の差
Dhom o,ci (t )  Aci (t )  A(t )
Dhom o, fj (t )  B fj (t )  B (t )
●異なるクラスのエージェントのコミュニティ活動平均値と自らの活動の差
Dhetero,ci (t )  Aci (t )  B (t )
Dhetero, fj (t )  B fj (t )  A(t )
●需要量または供給量の前期との差
Dvol,ci (t )  xci* (t )  xci* (t  1)
それぞれの符号
Dvol, fj (t )  y *fj (t )  y *fj (t  1)
モデル:態度変容ルールとレベル変数調整器
認知する
情報
Dhomo(t)
Dhetero(t)
Dvol(t)
3つ
状態
態度の調整
Dhomo(t), Dhetero(t), Dvol(t)
の符号の組み合わせ
(+, +, +) (0, +, +)
(+, +, 0) (0, +, 0)
(+, +, -) (0, +, -)
(+, 0, +) (0, 0, +)
(+, 0, 0) (0, 0, 0)
(+, 0, -) (0, 0, -)
(+, -, +) (0, -, +)
(+, -, 0) (0, -, 0)
(+, -, -) (0, -, -)
(-, +, +)
( -, +, 0)
( -, +, -)
( -, 0, +)
( -, 0, 0)
( -, 0, -)
( -, -, +)
( -, -, 0)
( -, -, -)
環境配慮態
度レベルを
態度変容ルール
1つの状態→調整行為
1:1上げる
0:変えない
-1:1下げる
3通り
27通り
レベル変数調整器
27個の態度変容ルールのセット
エージェントは27個の状態について、
態度調整の仕方をあらかじめ決めている
レベル変数調整器の種類 全部で327個
モデル:学習のサイクル
レベル変数の調整:個々の学習
σ回
t
相互参照による
調整器の学習
相互参照による
調整器の学習
集団の学習
調整器の学習における評価関数
●企業
集計利潤
●消費者
集計効用
 p(q fj (t )) y *fj (t ) 

 fj (t )    fj (t )   

c
(
q
(
t
))

p
g
(
s
(
t
))
t
t 

fj
B
fj


U ci (t )   uci (t )    (qci (t ))xci* (t )
t
集団の学習サイクル 十分長いz回
集団の到達するパターンを調べる

t
遺伝的アルゴリズムの手法
モデル:政策パラメータ
環境情報提供のパラメータ
●コミュニティにおいて
(例 環境報告書)
企業に環境対策に関する
内部情報の公開
↓
内部情報を収集する費用を削減
環境活動の単位コストパラメータ
pA、pB
●経済活動において
(例 環境ラベリング)
環境配慮製品の購入は
よいという認識を与える
↓
環境配慮製品の消費による満足
消費者の効用関数におけるパラメータ
ψ(q)=w0+w1q
w1を情報の有無により変化
パラメータ設定
エージェント数
企業 n=50,消費者 m=500
0期 すべてのエージェントの環境配慮レベルは0 s(0)=0
*以下、エージェントのIDおよび時間tを省略して表記
1期 消費者の環境配慮レベルが1になる確率 η=0.005
学習のサイクル σ=3 z=40(短期) z=200(長期)
環境配慮レベルの範囲 0以上5以下
コミュニティ活動値を与える関数 消費者 A=as, a=1, 企業 B=bs, b=1
財の価格の関数 p(q)=(1+hq)p,p=1,h=0.5
製品の生産コストを与える関数 c(q)=cq, c=20
消費者の所得一定値 E=20
消費者の効用における環境配慮製品の満足度を与える関数 Ψ(q)=w0+w1q
環境情報提供型政策のパラメータ
・コミュニティにおける政策
ない場合 pA=2, pB=10
ある場合 pA=0, pB=0
・市場における政策 ない場合 w0=1, w1=0.1
ある場合 w1を変化→w1=2.0
短期シミュレーション:環境情報提供の役割
環境配慮レベル1以上の企業数の時間変化
Agents
50
Agents
50
企
業
数
40
40
企
業
数
30
30
20
20
10
10
10
20
30
40
50
Time
時間
(a) 環境情報提供がない場合
10
20
30
40
50
Time
時間
(b) 環境情報提供がある場合
長期シミュレーション:環境情報提供の限界
環境情報提供がある場合における
各環境配慮レベルのエージェント数の変化
Agents
500
消
費
者
数
Agents
50
40
400
企
業
数
level 0
300
200
20
100
10
100
200
300
400
時間
(a) 消費者
500
Time
600
level 0
30
100
200
300
400
時間
(b) 企業
500
Time
600
結果の考察
●短期的には環境情報提供の効果
●長期的には環境配慮レベル0にロック
微少な消費者の変化
企業もそれに応じてレベル上げる
十分な需要を確保できない
環境配慮レベル下げる調整器を学習
レベルの高い消費者は自分のレベルの製品見つけられなくなる
環境配慮レベル下げる調整器を学習
環境配慮型製品選択のジレンマ
結果の考察
環境情報提供に期待されている役割
消費者は環境配慮製品の選択を学習
企業も環境配慮製品の選択を学習
社会全体として
環境配慮型
このようなメカニズムうまく機能しない
消費者集団の学習より速く、
企業集団がレベルを下げることを学習
情報提供の限界:
集団間の学習の不整合として理解される
モデルの拡張:知識普及の役割
環境配慮レベル最大値(5)に達したエージェントのうちのわずかの割合r%
「環境配慮レベルを上げるほうがよい」という評価
意識が高いエージェントのごく一部が啓発
発言数
知識としてストック = 広まる
NGOのグリーンコンシューマガイド
企業の啓発活動
環境報告書のHP
電子掲示板など
個々のエージェント
態度変化の閾値
知識ストックが自分のレベルを超えたら
レベルを下げないようにするインセンティブが次第に働く
長期的に社会が環境配慮型にシフトする状況をシミュレーションで
人工的に作る
モデルの拡張:知識普及の役割
評価知識ストックの時間変化
評価知識ストック
(c)
KnoledgeStock
300
啓発エージェントが
比較的多い社会
250
200
(b)
150
100
啓発エージェントが
少ないながらもいる社会
(a)
50
25
50
75
100
125
150
175
Time
200
時間
環境配慮レベル5のエージェント中の
評価情報を提供する割合r
(a) 0.01 (b) 0.02 (c) 0.05
啓発エージェントが
非常に少ない社会
シミュレーション結果:知識普及の役割
Agents
50
Agents
50
40
level 0
40
level 0
30
30
20
20
level 5
10
100
200
300
400
10
500
Time
600
(a)
Agents
50
level 5
100
200
300
400
500
Time
600
(b)
level 0
40
level 5
30
知識の普及により
環境配慮型社会に移行
20
啓発エージェントの役割
10
100
200
300
(c)
400
500
Time
600
シミュレーション結果:知識普及の役割
(a) 啓発エージェントが非常に少ない場合:知識蓄積ほとんどない
1社以外は0に引き戻される
社会に環境意識の高い消費者が一部いて
そのニーズに応える企業もわずかに存在する状況
(b) 啓発エージェントが少し入る場合:知識がゆっくり蓄積
多様なレベルの企業が共存
環境配慮は進んでいるがレベルは多様であるという状況
(c) 啓発エージェントが比較的多い場合:知識が非常に速く蓄積
すべてのエージェントはレベル5になる
社会の環境配慮型へのシフト
結果のまとめ
• 環境情報提供の限界
消費者と企業の集団間の学習の不整合
環境配慮型製品選択のジレンマ
• 限界を超える社会のデザイン:知識普及の役割
環境意識高いエージェントのコミットメント(提
供された情報に対する評価をする)の役割
今後の課題
モデル
• 2段階認知ルール 構成要素
• 知識普及のモデル化 評価知識ストックの扱い
知識の減耗
エージェントが知識として取り込むプロセス
• 企業のモデル 組織のモデル 在間(2001)
モデルの応用
• タバコのポイ捨て行動の問題
など