Document

インディペンデント・エージェントによる集団行動の学習
Learning of Group Behavior by Independent Agents
研究代表者
信州大学工学部機械システム工学科
助手
森
共同研究者
大阪大学大学院基礎工学研究科
教授
宮 崎
[研究の目的]
本研究では,インディペンデント・エージェ
亮 介
文 夫
かの作業を行うことや,複数台のロボットで協
調して作業を行うことなど,より高度なタスク
ントとして,単眼視覚をもつ移動ロボットを用
の実現に向けてさまざまな研究が行われている.
い,集団による協調タスク,たとえは,飛来す
このような高度なタスクを実現するためには,
るボールを打ち上げ続けるタスクを考える.ヒ
ロボットの知能化が重要であり,センサで得ら
トに置き換えるとバレーボールのようなタスク
れた動的な環境の変化に応じて,目標のタスク
であり,このタスク実現にはヒトが長年の練習
を実現するために,適切な行動を決定し,動作
の成果として身につけるスキルを,いかにロボ
を生成することが可能な知能ロボットの開発が
ットに学習させるかを考える必要がある.ボー
必要である.そこで本研究では,知能ロボット
ルの動きと個々のロボットの動きという変動す
の開発の一例として,ヒューマンスキルを実現
る状況に応じて目標のタスクを実現するための
する知能ロボットシステムの開発を目的として
行動決定アルゴリズムを構築する.人間と同等
研究を行う.
あるいはそれ以上に優れた集団行動を生成する
本研究で考えるヒューマンスキルとは,野球
ことが可能な知能ロボットシステムを開発し,
やサッカー,テニスなどの球技において,初心
ヒトの高度なスキルをロボットで実現するだけ
者が練習を重ね,熟練者にいたる過程において
でなく,ヒトがスキルを獲得するまでの過程に
身につける「コツ」のようなものであり,運動
ついても検討することを目的とする.
時の人の動作をロボットにあてはめ,目標とす
るタスクを実現するために必要なシステムを構
[研究の内容,成果]
本研究の目的である複数台の知能ロボットに
よる協調動作(集団行動)を実現するためには,
築し,「コツ」を身につけるまでの過程をロボ
ットを通して明らかにするというのが本研究の
目的である.
まず,高度なタスクを実現可能な知能ロボット
本研究では,目標とするタスクとして,ボー
の開発が重要である.そこで,本稿では,ヒュ
ルリフティングを考える.ボールリフティング
ーマンスキルの一例として,ボールリフティン
は,テニスやサッカーのようなボールを用いる
グタスクの実現に向けた知能ロボットの開発に
球技において基礎的な練習に位置づけられる.
ついて述べ,本研究の目的を実現するために,
初心者がボールの扱いに慣れるために,ボール
検討すべき課題や問題点を明らかにする.
を連続して打上げ(蹴り上げ)ることによって,
ボールを適切な軌道に打上げ,さらに次の落下
1
研究の背景,目的
近年のロボットの研究は,手足や目などの
地点にラケット(足)を正しく位置決めすると
いうような,視覚情報に基づく運動制御を行う.
個々の機能システムの開発から,それらを統合
この基本動作を繰り返すことによって,ボール
したシステムを構築し,さらに具体的なタスク
を思い通りに操ることが可能となる.このボー
の実現をめざす段階にある.例えば,移動機構
ルリフティングタスクをロボットに行わせるこ
にマニピュレータを搭載し,移動しながら何ら
とによって,ヒトが基礎的なタスクを実現する
α
ラケット
カメラ
移動台車
図1
ノートPC
ボールリフティングタスクの概略図
図2
ボール捕獲戦略モデル
率で増加し続けるように移動することによって
ためのスキルを身につけるまでの学習過程を明
ターゲットを追跡することができる.この動作
らかにすることが本研究の目的である.
戦略は,実験心理学におけるヒトのボール捕獲
2
時の動作戦略に基づいており,本研究の単眼視
ボールの追跡捕獲戦略
本研究で行うボールリフティングタスクは視
覚情報に基づく運動制御という点で,まさしく
視覚フィードバックの基本例題に位置づけられ
る.図 1 に単眼視覚をもつ移動ロボットによる
ボールリフティングタスクの概略図を示す.
覚をもつ移動ロボットによる3次元移動物体の
追跡タスクに非常に適している.
3
ボールリフティングロボットのシステム
構成
前節で述べた追跡理論を制御則の形で具体化
ボールリフティングタスクは,打ち上げたボ
し,単眼視覚をもつ移動ロボットに適用した(詳
ールの次の打撃点にラケットを位置決めする移
細については論文 2)を参照).本節では,本
動ロボットの軌道制御と,目標の軌道にボール
研究で開発したボールリフティングロボットの
を打ち上げるためのラケットの打撃速度と角度
システム構成について述べる(図 3 参照).制
の制御の2つのフェーズに分けられる.3次元
御対象を移動ベースと打撃機構,制御部をノー
的に移動するターゲットを追跡し,その落下位
ト PC,検出部をカメラとする.移動ベースのサ
置に素早く到達する必要があるため,できる限
イズは全長と全幅が 300[mm]であり,直進時の
りシンプルなシステム構成にすることが重要と
最高速度は 1.2[m/sec]である.各部で行われる
なる.そのため,画像処理システムには単眼視
処理については,ボールの追跡のための移動ロ
覚を用い,さらにターゲットの軌道を捉えるた
ボットの軌道制御と,ボールの打上げのための
めにカメラの方向の制御を必要としない魚眼レ
打撃機構の制御に分けて述べる.
ンズを用いることにする.これにより,移動ロ
魚眼レンズ付 IEEE1394 カメラで得られたボ
ボットに搭載する画像処理システムはシンプル
ールの画像を2値化し,ボールの重心位置を求
かつ軽量となり,移動ロボットの走行性能の低
め,ヤコビ行列から移動ロボットの左右の車輪
下を引き起こすことはない.
速度を計算する.つづいて,左右の車輪の速度
上記のような単眼視覚による画像システムを
指令を RS-232C を介して移動ベースに通信し,
用いて,3次元的に移動するターゲットを追跡
ボールの追跡のための軌道制御を行う.また,
するために,ターゲットの3次元位置情報を必
ボールの画像上の面積(画素数)からボールの
要としない追跡方法を考える.図 2 に示すよう
打ち上げタイミングを求め,ソレノイドからな
に鉛直上向きにロボットに搭載したカメラから
る打撃機構により,落下してくるボールをタイ
見たボールの仰角を,ヒトから見たボールの仰
ミングをあわせて打上げる.以上の処理が行わ
角αと考え,この正接 tanα が有限の時間変化
れ,リフティング動作を行うことが可能となる.
度を考慮する必要があり,画像上のボールの画
素数はボールの速度が大きいほど,変化が大き
くなる傾向があるので,これを出力関数として,
打撃のタイミングを決定する.画素数が 100 を
超えたときの N に対してその直前の画素数 Nold
として,次式より,打撃指令を与えるサンプリ
ング時間遅れ TS を計算する.
TS=K/(N-Nold )
ただし,K は実験結果をもとに適当な値を用い
図3
3.1
ボールリフティングロボット
リフティングデバイスの構成
移動ロボットに搭載するために,ソレノイド
と1軸のモータからなるシンプルな打上げ機構
を製作した.ソレノイドに電流を流す時間を変
化させることによって,大,中,小の 3 段階の
打上げ速度を得ることが可能であり,ヒトがリ
フティングタスクを行う場合と同様にボールの
軌道に合わせて,打上げ速度を調節することが
できる.さらに,ラケットの傾きを変えること
で,目標の軌道にボールを打ち上げることも可
能である.このリフティングデバイスを用いる
ことで,ボールの軌道が低い場合は打上げ速度
を大きくすることで高く打ち上げたり,ボール
を前方に打ち上げすぎた場合は,ラケットを後
方に傾けてボールを後方に打ち上げたりという
ようなボールの軌道のコントロールを行うこと
が可能である.
3.2
打上げタイミングの決定方法
ている.この方法を用いることで,例えば 100cm
の高さから自然落下させた場合と比べて,60cm
の高さの場合に,タイミングが 4×33[msec](カ
メラのサンプリングレート)分遅れているにも
かかわらず,適切に打上げることが可能となっ
た.
ただし,照明条件やラケット面上のボールの
打撃位置などの影響で,この簡便な方法による
打撃成功確率は現状では 7 割程度であるため,
ボールリフティングタスクを実現する上ではよ
りロバストな打撃動作生成のアルゴリズムが必
要と考える.
4
ボールリフティングタスクの実験結果
ボールリフティングタスクの実現を目的に開
発したリフティングロボットを用いて実験を行
った.実験の手順を以下に示す.ロボットのほ
ぼ 真 上 の 高 さ 80 ~ 100[cm] の 位 置 か ら , 直 径
44[mm]のピンポン球を自然落下させる.3.2 節
で述べたように,魚眼レンズ付カメラでとらえ
たボールの画像サイズをもとに適切なタイミン
前節で述べたリフティングデバイスを用いて, グをとって,ロボットはボールを打上げる.つ
づいて,打上げたボールの軌道にしたがって,2
画像処理結果からボールを打上げる基礎実験を
行い,打上げタイミングの決定方法を検討した.
節で述べたように次の打撃地点に向かって追跡
今回の実験で使用したカメラのフレームレート
動作を行い,さらに落下してくるボールを打上
は 30[fps] で あ る . 画 像 上 の ボ ー ル の 画 素 数
げることによって,ボールリフティングタスク
N=100 を打上げのタイミングをとるための閾値
を行う.
として,N>100 となったサンプリング時にソレ
図 4 にボールリフティングの実験結果を示す.
ノイドに打撃の指令を与える.また,打上げの
図で,○印で打上げられたボールの軌道を示し,
タイミングを決めるためには,ボールの落下速
×印でロボットの追跡軌跡を示している.
z[m]
じて,適切に目標とするタスクを実現するため
1
の行動を生成することが可能な知能ロボットを
0.8
開発し,実験によりその性能と改善点を評価し
0.6
たところである.今後は,本研究課題の目指す
ところである集団行動の実現にむけて以下の点
0.4
について,研究を行っていきたいと考える.
0.2
 1 台のロボットによるリフティングタスクを
0
0.5
実現したものの,現状の 1 軸のみのラケット
0.8
0
0.4
の角度調整では,思い通りに打ち上げたボー
0.2
y[m]
-0.5
図4
0.6
-0.2
0
x[m]
ルの軌道を制御することは難しいので,2軸
の角度調整機構の開発を行う(これについて
ボールリフティングタスクの実験結果
この結果から,ボールの軌道に対して,適切
は,すでにリフティングデバイスは開発済で
に落下位置に到達し,落下してくるボールに対
あるが,ボールの軌道に対する角度調整のア
して適切にタイミングをとって,ボールを打ち
ルゴリズムがまだ不十分であるため,本稿で
上げることによって連続してボールを打上げる
は結果を割愛した).
リフティングタスクを実現していることがわか
 集団行動の基礎として,まずは2台のロボッ
る.(実験結果の動画については 3)の HP を
トによるパスタスクを行い,協調動作におけ
参照.)
る 適切 な行動 生成 のため のア ルゴリ ズム を
実験結果を詳しく見てみると,打上げられた
構築する(こちらについても,すでに2台の
ボールの軌道から,打上げ高さが大きい場合は
ロボット間でのパスタスクの実現にむけて,
弱く打上げ,小さい場合は強く打ち上げるとい
基礎的な性能評価実験,およびシミュレーシ
うように,打上げの強弱を適切に調整し,リフ
ョンによる検討を行っており,結果について
ティングを行っていることがわかる.さらに,
は,国際会議等にて報告する予定である).
打上げはじめの段階では,前方にボールが打ち
上げられているが,移動距離にしたがって,後
方にラケットを傾けてボールを打ち上げること
[成果の発表,論文等]
1)
R. Mori, F. Takagi and F. Miyazaki : Development of
によって,最終的にほぼ真上にボールを打ち上
Intelligent Robot System Realizing Human Skill - Rea-
げるリフティングを行っていることもわかる.
lization of Ball Lifting Task Using a Mobile Robot with
以上の結果から,現状のロボットのシステムで
Monocular Vision System -, Proceedings of International
ボールリフティングタスクを行うのに必要な性
Conference on Robotics and Automation, pp. 1280-85,
能を備えていることがわかる.
2006.
[今後の研究の方向,課題]
2)
よるボールリフティングタスクにおけるスキル獲
本稿では,複数台の知能ロボットによる集団
得,第 48 回自動制御連合講演会予稿集, pp.757-762,
行動の実現に向け,その基礎となる知能ロボッ
2005
トの開発を行った結果について述べた.現状で
は,1台のロボットによるボールリフティング
という,カメラで捉えた動的な環境の変化に応
森,高木,宮崎:単眼視覚をもつ移動ロボットに
3)
http:/chida-lab.shinshu-u.ac.jp/mori/mobrobo.html