群知能とネットワーク型制御

群知能とネットワーク型制御
生天目 章
防衛大情報工学科
www.nda.ac.jp/nama
0 - 電通大 ’10
概要
1.群知能と集合知
2.群れ行動の創発と背後にあるネットワーク構造
3.ネットワーク制御:コンセンサス(合意)問題
4.複雑系の制御:内的要因と外的要因の複合
1 - 電通大 ’10
群知能
全体の動きを指示するリーダー的な存在がなくても,個々に行動ル
ールをもって動作する多くの個体の集団に,餌を効率的に獲得した
り,天敵から身を守るための集団としての知恵が生まれるとき,
一般に“群知能”という.具体的には
(1)蟻の餌集め
(2)蟻塚,すなわちアリがコロニー形成に見られる知恵
(全長が1センチ程度のアリは,オーストラリアやアフリカ では10メートル以上の高さの蟻塚を作る)
(3)バクテリアや細菌のコロニー
(4)鳥,魚,動物の群れ形成
2 - 電通大 ’10
集団行動と群知能
Œ
Œ
人間社会に目を移すと団体によるシンク
ロスイミング,ダンスそしてチェアリーダ
等によるマスプレー.
一人一人は,音楽と隣人の動作に歩調
を合わせることで,大変美しい,リズムを
伴った運動になる
3 - 電通大 ’10
社会の営みと集合知
:交通システムや銀行の取引システムなど,巨大で複雑なシ ステムを設計し,うまくマネージメントしていくことは,非 常に困難な課題.
:設計者が全体像を描いて設計する従来の方法には限界がある.
4 - 電通大 ’10
社会の営みと集合知
ネットワーク社会とグローバル化
: 見知らぬ人々がネットワークで結合され,目的や情報を共有し合
うことで,協調し合う機会が増大しつつある.
Œ 多くの人々の力がうまく結集されることで,社会や組織は円滑に,
そして効率的に運営される.
Œ 多くの人々の力を結集するには全体として知性を生み出す必 Œ 要があり,全体の知性を集合知という.
Œ
Œ
Œ
アリ,鳥,魚の群れ行動に複雑システムの制御に役立つ知恵
やヒントが隠されている?
5 - 電通大 ’10
自然界と社会に見られる
創発現象
6 - 電通大 ’10
自然界における創発現象
西部大砂丘の風紋 「砂漠の世界」より
• 砂丘の表面には「風紋」(ふうもん)と いって、風によって作られた規則的な模
様がついており、太陽の位置によって美しい陰影(いんえい)が変化してゆきま
す。そうしている間にも、沙漠を渡る強 めの風は、砂を運んでその斜面を駆(
か)け上がり、稜線(りょうせん)の部分から下へ落として行きます。これが休み
なくおこなわれる結果、砂山自体が移動するようになるのです。この砂山も、
一年後にふたたび訪れてみると、10kmも風下方向に移動していました。
7 - 電通大 ’10
非線形現象と創発に関する研究
近接的な相互作用 ゆらぎ(時空間的に不均一な局所的秩序)
散逸構造
(非平衡開放系:エネ
局所的な秩序が成長し,臨界点を越えたとき
ルギーの流入,散逸)
周期的な秩序の創発
リズム/同期
(時間的周期性)
BZ反応
細胞性粘菌の模様
Winfreeら(1984)
パターン
(空間的周期性)
拍手の同期
ホタルの発光の同期
Nedaら(2000)
Buck(1988)
8 - 電通大 ’10
社会システムと創発現象
Internet
9 - 電通大 ’10
情報ネットワークの複雑な挙動
自己相似性
相転
予期しない動
メタ安定
0.30
Probability
0.20
0.10
Internet
throughput
synchronization
among Internet
routers
10
00
0
20
00
0
30
00
0
40
00
0
50
00
0
60
00
0
70
00
0
80
00
0
90
00
10 0
00
0
11 0
00
0
12 0
00
0
13 0
00
0
14 0
00
0
15 0
00
0
16 0
00
0
17 0
00
0
18 0
00
0
19 0
00
0
20 0
00
>2 00
00
00
0
0.00
distribution of
call types in
wireless cells
Time
grid job completions
外生的要因:ネットワーク構造や外部の故障
内生的要因:ユーザーの利用上の変化
10 - 電通大 ’10
群れ行動の創発と背後にあるネ
ットワーク構造
11 - 電通大 ’10
群知能とネットワーク構造
:集団行動
:負荷分散
:群れ行動
集合動作を制御する上での工夫は,背後にある
“ネットワーク構造”に隠されている?
12 - 電通大 ’10
創発現象:整列,行進
Œ
Œ
Œ
行動ルール
• 直近(局所的)の前と左右の人と合わせる
相互作用
• 各自が行動ルールを実施して合わせていく
全体の挙動
• 整列,行進
前進方向
13 - 電通大 ’10
群れ行動に関する疑問
<生物学的見地からの疑問>
: なぜ群れを作るのか?
: なぜ生物によって群れが異なるのか?
<工学的見地からの疑問>
:どのような仕組みで群れができるのか?
:群れの最適なパターンとは?
14 - 電通大 ’10
群制御
・ 自律ビークルの航行制御
車両の自動縦列走行
艦船の自動陣形航行
無人航空機の編隊飛行
・ 人や生物の集団での移動の制御
災害時の避難誘導
家畜の誘導
15 - 電通大 ’10
Boidsモデル(1)
C.W.Reynolds(1999)
"Steering Behaviors For Autonomous
Characters",Game Developers Conference
個々のエージェントに簡単な3つの行動ルールを与える
⇒ 近傍のエージェントどうしの局所的な相互作用
⇒ 全体として,群れ行動が創発
Cohesion
近傍のエージェントの
中心の方向へ近づく.
Separation
近傍のエージェントから
離れる.
Alignment
近傍のエージェントの平均速度に
速度(向き)を合わせる.
16
16 - 電通大
’10
Boidsモデル(2)
目的:映像美の追求
生物の群れ行動
多数の映画や
ゲーム等で利用
Reynolds(1986)
Reynolds(2000)
蔡(2002)
17 - 電通大 ’10
初期状態:個々に孤立
個々に離散しているエージェントの集まりには,
群れは形成されないことは,明らか.
群れ行動
視界
離散状態
(非連結ネットワーク)
Cohesion,Separation
及びAlignmentルールを
発火できない
連結ネットワーク
18 - 電通大 ’10
近傍と遠方の仲間の参照
遠方のゴール
やパスの相手等
脳波(0.01~1s)
遠方:時々参照
近傍:頻繁に参照
距離に応じた参照方法
• 近傍の仲間
•常時(短周期)
•同じ仲間
• 遠方の仲間
•散発的,断続的
•参照相手は変動
19 - 電通大 ’10
ランダムで間欠な参照モデル
• 近傍エージェント:常時参照
• 遠隔エージェント:間欠な参照
• 各ステップ毎,ある小さな確率で
ランダムに選んだ遠方のエージェ
ントを参照する:参照確率p
20 - 電通大 ’10
参照確率(p)と群れ創発の関係(1)
群れ行動の創発
・ 凝集
・ 近傍エージェント数の増加
・ 速度の同期
拡散
参照確率
p < pc
群れ行動は創発されない
pc < p
p=10-3
群れ行動が創発される範囲
p=1
凝集:速く,高密度
速度の同期:速く,高
臨界参照確率pcが存在
21 - 電通大 ’10
参照確率(p)と群れ創発の関係(2)
ランダムリンク生成確率
p:極めて小
p=1
p:小
疎なネットワーク
僅かなランダムリンク
群れ行動:創発なし
僅かなランダムリンク
完全連結ネットワーク
ランダムリンク
+近傍リンク
群れ行動:創発
pの臨界点pcが存在
22 - 電通大 ’10
参照確率(p)と群れ創発の関係(3)
エージェント
クラスタの規模
G
p=10-3
2
4
3
200node
p=10-4
代数的連結性
非連結
1
(λ2>0) 連結
2
4
3
λ2
最大固有値
λmax
1
固有値の変化に着目し,
動的ネットワークの時間的変化
の構造推移を捉える
p=10-3
p=10-4
23
23 - 電通大 ’10
ネットワーク制御:
コンセンサス(合意)問題
24 - 電通大 ’10
ネットワーク制御
Œ
Œ
Œ
Œ
Œ
ネットワーク結合されたシステムの分散制御
(1)ネットワーク構造の性質を利用した制御
(固定型ネットワーク上での制御)
(2)ネットワーク構造の制御
(可変型ネットワーク上での制御)
Source: Olfati-Saber 2007 [C1]
[01]: Olfati-Saber 2007
25 - 電通大 ’10
感染モデル( SIR モデル)
Œ
• Susceptible: 感染していない状態
• Infected: 感染している状態
• Recovered: 治癒している状態
感染確率: p 治癒率: q
閾値現象:感染爆発の条件 (p/q) > 1
(ランダムな接触モデル:ネットワーク構造なし)
感染割合
Active phase
Virus death
λc
相対的感染率
λ
26 - 電通大 ’10
ネットワーク構造に着目した制御
2
隣接行列
3
1
4
5
⎛0
⎜
⎜1
A = ⎜1
⎜
⎜1
⎜0
⎝
1
0
1
0
1
1
0
1
1
0
1
0
1
0
0
0⎞
⎟
1⎟
0⎟
⎟
0⎟
0 ⎟⎠
対称行列の固有値: 実数値 λ1 ≥ λ2 ≥ " ≥ λn
(p/q) λ1 (A ) > 1
感染爆発!!
感染拡大の最小化:最大固有値 λ1 (A ) の最小化
情報伝播の最大化:最大固有値 λ1 (A ) の最大化
27 - 電通大 ’10
最適なネットワーク構造
F = ωλ1 + (1 − ω )α
• 拡散の最小化
ω=0.1
λ1=2.35
λn=-2.35
ω=0.5
D=46
α=1.98
λ1=3.61
λn=-3.61
ω=0.5
λ1=3.79
D=46
α=1.98 λn=-3.79
リンク密度(平均次数)
ω=0.9
λ1=2.38
λn=-2.38
• 拡散の最小化
ω=0.1
α
D=50
α=1.98
λ1=2.48
λn=-2.48
D=48
α=1.98
F = ω / λ1 + (1 − ω )α
ω=0.9
λ1=8.43 D=48
D=50
α=1.98 λn=-3.41 α=1.98
ω=0.92
λ1=8.18 D=14
λn=-2.96 α=2.52
ω=0.95
λ1=10.27 D=11
λn=-2.98 α=2.88
ω=0.98
λ1=14.2 D=9
λn=-3.21 α=3.8
ω=1
λ1=100.0 D=2
λn=-1.98 α=98.98
28 - 電通大 ’10
同期現象とコンセンサス(合意)問題
Œ
同期現象
• 複数の振動子(振動するもの一般)が相互作用により,
同じ周期になる現象(蔵本 2007)
• 同期が生まれるまでの速さは,ネットワーク構造が影響
•ホタルの発光(Buck 1988)
•コオロギ鳴き声(Sismond 1990)
•心筋細胞の信号(Peskin 1975)
•拍手(Nedaら 2000)等
29 - 電通大 ’10
コンセンサス(合意)問題
x(t ) = ( xi (t ) " xn (t ) )
Œ
各エージェントの内部状態
Œ
系のダイナミクス:内部状態の分権型適応 if
xi (t ) =
∑a
j∈N i
ij
T
( x j (t ) − xi (t )) x (t ) = − Lx (t )
Œ
コンセンサスの実現
Œ
離散時間表現
∑ a (x
j∈ N i
t →∞
1
xi (0)
∑
n i
α=
x ( k + 1) = x ( k ) + ε
G
then lim x(t ) = α 1
ij
j
(k ) − X i (k ))
= x ( k ) + ε (− Lx ( k ) ) = ( I − ε L ) x ( k )
x ( k + 1 ) = Px ( k )
P = I − εL
0 < ε < 1/ Δ
Δ=最大次数
30 - 電通大 ’10
ラプラシアン行列
隣接行列
次数行列
⎛ 0 a12 a13 a14 ⎞
⎟
⎜a
a
a
0
21
23
24
⎟
A=⎜
a
a
a
0
⎜ 31 32
34 ⎟
⎟
⎜a a a
0
⎠
⎝ 41 42 43
⎛ d11 0 0 0 ⎞
⎜0 d
⎟
0
0
22
⎟
D=⎜
0
0
d
0
33
⎜
⎟
⎜0 0 0 d ⎟
44 ⎠
⎝
⎛ d11 − a12 − a13 − a14 ⎞
⎜
⎟
a
d
a
a
−
−
−
⎜
22
23
24 ⎟
L = D − A = ⎜ 21
− a31 − a32 d33 − a34 ⎟
⎜
⎟
⎜− a − a − a
d44 ⎟⎠
42
43
⎝ 41
ラプラシン行列
• 例:
2
3
1
4
5
⎛0
⎜
⎜1
A = ⎜1
⎜
⎜1
⎜0
⎝
1
1
1
0
0
0
0
1
1
1
1
1
0
0
0
0⎞
⎟
1⎟
0⎟
⎟
0⎟
0 ⎟⎠
⎛ 3
⎜
⎜−1
L = ⎜−1
⎜
⎜−1
⎜ 0
⎝
∑
⎧ aij (i = j)
⎪
dij = ⎨ j
⎪⎩ 0
(i ≠ j)
−1
−1
−1
3
0
0
2
−1
−1
−1
−1
−1
0
3
0
0 ⎞
⎟
− 1⎟
0 ⎟
⎟
0 ⎟
1 ⎟⎠
31 - 電通大 ’10
ラプラシアン行列とネットワーク構造の性質
Œ
ラプラシアン行列
• 固有値
L = D− A
次数行列隣接行列
0 = λ1 ≤ λ2 ≤ " ≤ λn = λmax
完全グラフ
点グラフ
L
0 = λ1 , λ2 = " = λmax = n
1
2
3
1 ⎛ 1 −1 0
⎜
⎜ −1 1 0
= 2 ⎜
3 ⎜ 0 −1 1
⎜0 0 0
⎝
4
0 = λ1 = λ2 = " = λmax
1
4
0⎞
⎟
0⎟
0⎟
⎟
0 ⎟⎠
4
2
3
(n:エージェント数)
(1)ネットワークの連結性:第2最小固有値
• 非連結: λ2 = 0
• 連結: λ2 > 0
(2)ネットワーク粗密性:最大固有値の大きさ
λmax ≤ G
最大エージェントクラスタのエージェント数
λmax
が小さいと,疎なネットワーク構造
(3)合意(同期)速度
λn / λ2 :代数的連結:小さいほど収束が速い
32 - 電通大 ’10
ネットワークの最適化:
二つのタイプの最適化問題
• タイプ1:ネットワーク構造の最適化(可変型構造)
• タイプ2:接続係数(リンク重み)の最適化(固定型構造)
タイプ1
タイプ 2
33 - 電通大 ’10
ネットワークの最適化(タイプ2)
xi (t + 1) = wii xi (t ) + ∑ wij ( x j (t ) − xi (t ))
i∈N i
The weighted adjacency matrix W=(wij)
x(t + 1) = Wx(t )
•固定型ネットワーク
W = I − αL
L = D− A
α = 2 /{λ2 ( L) + λn ( L)}
•可変型ネットワーク
max{λ2 (W ), − λn (W )} を最小にする W
∑
i≠ j
wij = ∑ j ≠i w ji
34 - 電通大 ’10
ネットワーク上での合意問題(1)
代数的連結比と収束速度の関係
Œ
線型ネットワーク
• 平均リンク数:2
• λn / λ2 = 1458
• λ2 :0.003
• λn :4
完全ネットワーク
• 平均リンク数:60
• λn / λ2 = 1
• λ2 :60
• λn :60
State
800
State
Œ
円型ネットワーク
• 平均リンク数:2
• λn / λ2 = 365
• λ2 :0.01
• λn :4
1≤ i ≤ n
2000
State
Œ
xi (0 ) = i :
10
Time(sec)
35 - 電通大0.15
’10
ネットワーク上での合意問題(2)
λn
E (ω ) = ω ⋅ + (1 − ω ) ⋅ α
λ2
ランダムネットワーク
ω=0.1
ω=0.2
λn / λ2 代数的連結比
α
リンク密度(平均次数)
ω=0.3
ω=0.4
ω=0.5
λ2=0.7
α=3.3
λn=7.57
P=1.36
λn/λ2=10.81
λ2=1.07
λn=8.00
λn/λ2=7.38
α=3.9
P=1.35
λ2=1.65
λn=8.64
λn/λ2=5.25
α=4.7
P=0.68
λ2=2.16
λn=9.49
λn/λ2=4.39
α=5.3
P=0.64
λ2=2.83
λn=10.69
λn/λ2=3.78
α=6.2
P=0.66
λ2=0.27
λn=8.92
λn/λ2=33.2
λ2=0.48
λn=9.54
λn/λ2=20.0
α=4.0
P=2.41
λ2=0.77
λn=10.64
λn/λ2=13.9
α=4.7
P=1.4
λ2=0.96
λn=11.71
λn/λ2=12.3
α=5.3
P=1.82
λ2=1.73
λn=13.47
λn/λ2=7.8
α=6.2
P=2.2
α=3.4
P=2.23
36 - 電通大 ’10
ホッケの渦状の行動に隠されている知恵
‹共通の餌場を知っている.
‹餌場に最短経路で急行して,餌を独り占めするような行動はとらない
‹他の仲間との群れ行動を優先しながら,時々餌場に指向するような行動をとる
渦状の形態,すなわち球面体の群れパターンは,大規模なホッケ集団が群れを形成
するうえで最適なパターンになっている
37 - 電通大 ’10
群知能の例:餌場へ向かう
Œ
群れ行動をとりながら,餌場へ指向させると
• 群れが団子状態になります.すべてが同じ目的地に向かうためです.そして,
餌場付近で振動するような群れ行動になり,現実と合わない
• そこで,餌場に向かうことを時々思い出すというルールに変更すると,餌場を
中心に楕円運動になり,現実のホッケの群れに似てくる
餌場
餌場への指向
群れ行動
(CSAルール)
38 - 電通大 ’10
なぜホッケの群れは渦状の軌道を描くのか?
(1) 円軌道を描く理由:共通の目的地
を指向している
(2) 球面体の運動: 速度及び位置情報
の整合(合意(コンセンサス)を取る上で
最も最適な形状(パターン)である
初期位置
進行方向
餌場
軌跡
39 - 電通大 ’10
複雑系の制御
:外生及び内生的要因の複合
40 - 電通大 ’10
外生的リスク(外乱)の扱い
x(t ) = (xi (t ) " xn (t ) )
T
Œ
系の内部状態
Œ
系のダイナミクス:
x ( k + 1 ) = Px ( k ) + ε ( k )
ε ( k ) : 小さな加法型ノイズ
Œ外乱に対する系のロバスト性の維持 41 - 電通大 ’10
Millennium Bridge(ミレニアムブリッジ)
:2000年のミレニアム事業として、
ロンドン市はテムズ川南側(バンク
サイド)を再開発
:オープニング当日,想定外の横揺
れにより破壊
:約18か月後に再開通
42 - 電通大 ’10
設計上の考察
•人々の歩行速度:1秒間に2ステップ (2hertz)
• 歩行者の足が着地する度に,わずかな力(重力)が橋の右側
あるいは左側に加わる
•人々の歩行はランダムな運動とみなすことができ,橋の右側ま
と左側に加わる力は相殺される.
43 - 電通大 ’10
シミュレーション結果 (1)
個々の歩行者:右または左側をランダムに選択
選択の独立性:右側または左側へ加重する動作は相互に独立
右側または左側へ加重する歩行者の数
44 - 電通大 ’10
歩行者の行動
P(t): 右側に加重をおく歩行者の割合
p(t) > 0.5 (橋は右側に傾く)→ 左側に加重
p(t) < 0.5 (橋は左側に傾く)→ 右側に加重
Collective behavior
橋の揺れ方向
ミクロマクロループ
歩行者の行動
45 - 電通大 ’10
歩行者間の暗黙の調整
ミクロ・マクロループによる暗黙の調整
右側へ傾く
左側へ傾く
青色 : 右側に加重した歩行者の数
赤色 : 左側に加重した歩行者の数
46 - 電通大 ’10
Millennium Bridge(ミレニアムブリッジ)からの教訓
外生的リスク:システム外部からのショック
内生的リスク:システム内部で発し増幅されるショック(自己強化ループ)
H. Shin (2008)
システムリスク:外乱
システミックリスク systemic risk:意図しない内乱
47 - 電通大 ’10
システム挙動を決定づける内生と外生的要因
外生的要因:
連結された
他システムの変化
内生的要因
:相互作用
全体の挙動:外生及び内生的要因が複雑に絡み合うことで決まる
48
48 - 電通大
’10
人間行動に及ぼす内生的要素(1)
身近な人からの情報入手
社会動向調査からの情報入手
口コミサイトからの情報入手
49 - 電通大 ’10
外生的事象と内生的事象
(Sornnets, 2009)
50 - 電通大 ’10
ヒット現象
ヒット現象:時間に依存した過渡的現象
平衡状態に落ち着き,安定したヒットを続けるものはない
外生的要因:事前に宣伝されて購入意欲をそそられた人が発売
日に一斉に購入するために、急激な立ち上がりとなる。
内生的要因:噂・評判は,持続的なヒットに影響を与える
=>評判の良いものを作ることが大切
発
売
日
45000
40000
35000
30000
25000
20000
15000
(石井, 2008)
10000
5000
0
0
5
10
15
20
25
51 - 電通大 ’10
人間行動に及ぼす内生的要因(2)
ラーメン屋B
おいしいラー
メンを食べた
い
A
ラーメン屋
Cascade 現象:
階段状に連続した滝
「次へとつなげること」
他者行動から確かな情報を入手
しようとする,合理的な考え
52 - 電通大
52 ’10
社会現象:内生と外生的要因が絡み合う
100.0
カラーテレビ
90.0
80.0
j 70.0
・
i% 60.0
・ヲ
y・ 50.0
・ 40.0
・ 30.0
20.0
10.0
0.0
1960
1970
1980
乗用車
パソコン
1990
2000
西暦(年)
新製品の普及プロセス
日経平均株価の推移
53 - 電通大 ’10
ノードの故障モデル
故障
正常
重み係数:α
外的要因による故障率:qi
時点 t+1 における故障確率 p(t+1)
内生的故障率:S(t)
システム全体の故障率:S(t)
p (t + 1) = αqi + (1 − α ) S (t )
α∈[0,1] :内生的要因と外的要因の重み係数
54 - 電通大 ’10
故障の推移:内生的要因のみ
p (t + 1) = S (t )
N=1,000ノード
最悪ケース
平均的なケース
最良ケース
N=1,000
55 - 電通大 ’10
システム故障率に見られるマルチンゲール性
サンプル1
サンプル2
サンプル3
初期挙動
56 - 電通大 ’10
内生的要因と外生的要因の関係
故障率
故障確率: q (t + 1) = (1 − α ) p + αS (t )
重み
•
•
α
内生的要因の影響大:カスケード故障の予測は困難.
外生的要因の影響大:統計学的予測は容易.
57 - 電通大 ’10
ネットワーク上での連鎖モデル(1)
結合されているノードから
影響を受ける
58 - 電通大 ’10
ネットワーク上での連鎖モデル(2)
故障確率:
q (t + 1) = S (t )
正規格子ネットワーク
スケールフリーネットワーク
完全連結ネットワーク
•
ネットワーク連結性の増加:
カスケード故障の規模の予測は困難になる
59 - 電通大 ’10
まとめと私たちの課題:複雑系の制御
複雑な例(1):三菱東京とUFJ銀行システムの統合
:5月12日のトラブル(提携先セブイレブン銀行のATMから預金が引き出せなくな
る.被害件数 2万件(一日の取引件数:1億件)
:“うまく統合ができた!”という称賛より,非難を先行させる,国民性
複雑なな例(2):JR福知山線の脱線事故(2005),過密ダイヤの下,繰り返され
る,ヒューマンエラーに起因する事故
:江戸時代の河原での処刑のように,当事者に責任を押し付け,誰かを血祭りに
しないと,怒りを抑え納得することができない,国民性
“思考停止型”の国民性から脱却するための技術的課題とは?
(1)相互に連結された複雑システムを制御するための知識の体系化
(2)外生及び内生的要因が絡み合う複雑な因果関係を扱うための知識の体系化
群知能そして群制御の概念は役に立つのか?
60 - 電通大 ’10
ご静聴ありがとうございました!!
Question time
61 - 電通大 ’10