平成 27 年度卒業論文概要ロボティックスワームにおけるチェインフォーメーションの進化的獲得 B121877 岡村由一 0.4 0.2 0.0 0.2 fitness 0.6 0.8 1.0 【背景と目的】スワームロボティックシステム（Swarm Robotic Systems：SRS）とは，比較的単純で均質な多数の自律ロボットを用い，各ロボットの局所的な環境，状況下での相互作用を通して群れ行動を創発するシステムである．ロボティクスの分野において，未知の環境でのナビゲーション問題は重要な問題とされており，その戦略のひとつにアリの採餌行動における列の形成に着想を得たチェインフォーメーションがある．アリの列形成は動物行動学で経路追随型の戦略に分類されており，未知の環境におけるナビゲーションに有効である．本研究ではロボットによる未知の環境におけるナビゲーションを行うために，SRS の制御器を進化的手法により獲得させることで環境に適応的なチェインフォーメーションを形成する．そして，学習時のロボット台数の増加がチェインフォーメーションの形成にどのような影響を与えるかについて調べ，考察を行う．【実験設定】 30m 四方の壁に囲まれた環境に，2 つの目標地点と群れロボットを投入し，交互に通過すべき目標点を与える．ロボットが目標地点の周囲半径 3m のエリアに進入することを目標地点への到達とする．この二点をより多くの回数往復することがタスクの目的である．ロボットは，赤と青の LED により視覚的な相互作用を行う．制御器には人工神経回路網を用い，進化計算により結合荷重値を獲得する．進化計算には進化戦略 (Evolution Strategy:ES) における (μ, λ)-ES を用いる．制御器の評価関数は各ロボットに設定する仮想エネルギーの消費量をもとに，効率の良い経路での往復を行うほど高い評価値が得られるよう設定する．各制御器の評価は，ロボットが疎である環境から密である環境までを想定した，ロボット台数 N={10,20,30,40,50} 台について目標点間の距離を変動させて行う．【結果と考察】 Fig.1 のような挙動を獲得した．また，ロボット台数 N={10,20,30,40,50} 台での進化により獲得した 5 つの制御器について，それぞれの評価値を Fig.2 に示す．ロボット台数 10 台∼30 台での進化により獲得した制御器については，台数の増加に伴い適応度が上がっているが，40 台、50 台のものについては評価値の中央値が下がっている．ロボットが環境に密である場合に目標点付近で混雑である状況が生じ，学習を阻害していることが原因だと考えられる．このことから，ナビゲーション問題におけるロボット台数の増加は，必ずしも振る舞いの向上に繋がらないということがわかる． 10 20 30 40 学習時におけるロボット台数図 1: 得られた経路形成挙動図 2: 各制御器の評価値 50