ロボティックスワームにおける チェインフォーメーションの進化的獲得

平成 27 年度 卒業論文概要
ロボティックスワームにおける
チェインフォーメーションの進化的獲得
B121877 岡村 由一
0.4
0.2
0.0
0.2
fitness
0.6
0.8
1.0
【背景と目的】
スワームロボティックシステム(Swarm Robotic Systems:SRS)とは,比較的単純で均質な
多数の自律ロボットを用い,各ロボットの局所的な環境,状況下での相互作用を通して群れ行動
を創発するシステムである.ロボティクスの分野において,未知の環境でのナビゲーション問題
は重要な問題とされており,その戦略のひとつにアリの採餌行動における列の形成に着想を得た
チェインフォーメーションがある.アリの列形成は動物行動学で経路追随型の戦略に分類されて
おり,未知の環境におけるナビゲーションに有効である.本研究ではロボットによる未知の環境
におけるナビゲーションを行うために,SRS の制御器を進化的手法により獲得させることで環境
に適応的なチェインフォーメーションを形成する.そして,学習時のロボット台数の増加がチェ
インフォーメーションの形成にどのような影響を与えるかについて調べ,考察を行う.
【実験設定】
30m 四方の壁に囲まれた環境に,2 つの目標地点と群れロボットを投入し,交互に通過すべき
目標点を与える.ロボットが目標地点の周囲半径 3m のエリアに進入することを目標地点への到
達とする.この二点をより多くの回数往復することがタスクの目的である.ロボットは,赤と青
の LED により視覚的な相互作用を行う.制御器には人工神経回路網を用い,進化計算により結合
荷重値を獲得する.進化計算には進化戦略 (Evolution Strategy:ES) における (μ, λ)-ES を用い
る.制御器の評価関数は各ロボットに設定する仮想エネルギーの消費量をもとに,効率の良い経
路での往復を行うほど高い評価値が得られるよう設定する.各制御器の評価は,ロボットが疎で
ある環境から密である環境までを想定した,ロボット台数 N={10,20,30,40,50} 台について目標点
間の距離を変動させて行う.
【結果と考察】
Fig.1 のような挙動を獲得した.また,ロボット台数 N={10,20,30,40,50} 台での進化により獲
得した 5 つの制御器について,それぞれの評価値を Fig.2 に示す.ロボット台数 10 台∼30 台での
進化により獲得した制御器については,台数の増加に伴い適応度が上がっているが,40 台、50 台
のものについては評価値の中央値が下がっている.ロボットが環境に密である場合に目標点付近
で混雑である状況が生じ,学習を阻害していることが原因だと考えられる.このことから,ナビ
ゲーション問題におけるロボット台数の増加は,必ずしも振る舞いの向上に繋がらないというこ
とがわかる.
10
20
30
40
学習時におけるロボット台数
図 1: 得られた経路形成挙動
図 2: 各制御器の評価値
50