Sensorless Juggling Machines and Chaos for - ETH E

DISS. ETH NO. 22838
Sensorless Juggling Machines
and Chaos for Control
A thesis submitted to attain the degree of
DOCTOR OF SCIENCES of ETH ZURICH
(Dr. sc. ETH Zurich)
presented by
Philipp Sebastian Reist
M.Sc. ETH in Mechanical Engineering
born on 27. July 1982
citizen of Sumiswald, BE
accepted on the recommendation of
Prof. Dr. Raffaello D’Andrea, examiner
Prof. Dr. Russ Tedrake, co-examiner
Prof. Dr. Jonas Buchli, co-examiner
2015
Abstract
This thesis presents two main topics: A) The design and analysis of sensorless juggling
machines; and B) the development of control strategies for a class of nonlinear dynamic
systems.
In the first part, contributions to the field of robotic juggling are made that push the
boundary of what is possible in sensorless, robotic juggling of unconstrained balls. Specifically, we present the Blind Juggler (BJ) that can continuously bounce balls at heights
of up to two meters without sensors detecting the ball. The key design parameters that
provide local, open-loop stability to the ball trajectory are a concave, parabolic shape of
the paddle that is used to strike the ball, and the paddle’s acceleration at nominal ball
impact time. The stabilizing parameters were determined with a local stability analysis
of the ball trajectory, and were then further refined to optimize juggling performance
in an H2 -sense: The apex-height and impact-location standard deviations were predicted
using a linear input-output model of the bouncing ball together with process-noise power
spectral densities measured with a first prototype. While the analysis predicted that the
impact-location distribution cannot be significantly improved by optimizing the paddle
curvature, it allowed us to achieve a 27%-improvement in experimental apex-height standard deviation with an optimized paddle acceleration.
With the results obtained with the BJ, we built the Swinging Blind Juggler (SBJ),
which can bounce a ball in a side-to-side motion with the actuated paddle mounted
to a swinging, pendulum-like four-bar linkage. The thesis includes the detailed analysis
and design of the SBJ, and specifically its four-bar linkage. We further briefly introduce
juggling machines that were developed in side- and student-projects, and for outreach
purposes: The Cloverleaf Blind Juggler can simultaneously juggle four balls and has been
rented out to science exhibitions and museums; the Circular Cloverleaf Blind Juggler can
bounce a ball in a circular fashion on four tilted paddles; and the Juggling Ensemble is a
concept for a dynamic installation based on the BJ.
In the second part, we introduce a strategy for exploiting chaos to control a class of
nonlinear systems that have a symmetric structure: The systems are composed of subsystems with identical dynamics with a common control input. This symmetric structure
renders the systems uncontrollable in a deterministic sense, if the initial conditions of
their subsystems are identical: The subsystem-states remain identical irrespective of the
applied control input. We exploit the sensitivity of chaotic system dynamics to small
5
Abstract
disturbances that are typically present in physical realizations of the systems. The local
instability of chaotic trajectories amplifies these disturbances and causes the subsystemstates to diverge quickly, breaking the symmetry that makes control challenging. Furthermore, if the chaotic attractor underlying the chaotic subsystem dynamics is designed to
overlap appropriately with the respective subsystem goals, a straightforward strategy can
be applied to drive the overall system state to the goal: Wait until the chaotic subsystem
trajectories simultaneously reach the respective subsystem goals. This approach was analyzed, and successfully applied both in simulation and experiments with the Cloverleaf
Blind Juggler as a test-bed, since it features a suitable symmetric structure.
The waiting approach can be inefficient, i.e. can take arbitrarily long, since it relies on
random disturbances to drive the system to the goal. Therefore, it would be desirable to
only use chaos to break a possible symmetry in the system’s initial condition, and then
apply feedback-control to more quickly reach the goal. A possible approach is presented
with the Simulation-Based LQR-Tree algorithm, which generates control policies that
stabilize state- and input-constrained nonlinear systems to a goal from a set of initial
conditions. A generated policy consists of a set of feedback-stabilized trajectories that
lead to the goal. Key to the approach is the approximation of the set of states that can
be stabilized to the goal by a trajectory’s feedback-policy; this set is called the “funnel”
of the trajectory. Generating a policy that can stabilize a set of initial conditions to
the goal is equivalent to adding trajectories to the policy until their funnels cover the
set. The algorithm explores the set using random sampling, and uses motion-planning
to add trajectories to the policy where needed, i.e. where coverage by funnels is not yet
provided. Finally, when the generated policy is deployed, the set of trajectories is queried
for the trajectory whose funnel contains a given initial condition, and the determined
trajectory-policy is able to stabilize the initial condition by definition of the funnels.
The algorithm is a variant of the original LQR-Tree algorithm, where funnels are
approximated using sums-of-squares verification. In the simulation-based version, the
funnels are approximated with a falsification mechanism: Each trajectory has an associated funnel-hypothesis, which is a parametrized set of states. These funnel-hypotheses
are tested with the same random state samples used to explore the set of initial conditions: If a sample is in a hypothesis, the trajectory’s feedback policy is applied to the
sample in a simulation. If the system fails to stabilize to the goal, the hypothesis is falsified and shrunk to exclude the sample. With more samples, the hypothesis shrinks to
a better outer-approximation of the trajectory’s stabilizable set. The advantages of the
simulation-based variant over the original LQR-Tree algorithm are that it is applicable
to a broader class of systems, and that it is more straightforward to implement. A theoretical analysis of the asymptotic properties of the algorithm showed that in the long
run, the algorithm tends to improve both coverage and funnel hypotheses of the policy.
The theoretical findings are supported by simulation and experimental results with example nonlinear systems, where we achieved high coverage- and stabilizability-rates of
initial conditions, and which demonstrated the applicability of the approach to state- and
input-constrained, highly-dynamic systems.
6
Kurzfassung
In dieser Arbeit werden zwei Themen behandelt: 1) Das Design und die Analyse von sensorlosen
Jongliermaschinen und 2) die Entwicklung von Regelstrategien für eine Klasse von nichtlinearen
dynamischen Systemen.
Im ersten Teil werden Beiträge im Gebiet des robotischen Jonglierens gemacht, welche Fortschritte darstellen im sensorlosen, robotischen Jonglieren von sich frei bewegenden Bällen. Dazu
stellen wir den Blind Juggler (BJ) vor, welcher ununterbrochen Bälle mit einer Sprunghöhe von
bis zu zwei Metern jonglieren kann; und dies ohne jegliche Sensoren, um die Bälle zu detektieren. Die Schlüsselparameter, die eine mit offenem Regelkreis erzielbare lokale Stabilität der
Balltrajektorie ermöglichen, sind eine konkave, parabolische Form der Jonglierplatte und deren Beschleunigung beim nominellen Ballaufschlagszeitpunkt. Die stabilisierenden Parameter
wurden zuerst in einer lokalen Stabilitätsanalyse der Balltrajektorie bestimmt und anschliessend optimiert, um die Jonglier-Performance zu verbessern in einem H2 -Sinne: Die Standardabweichungen der Ballsprunghöhe und des Aufschlagsortes wurden berechnet mit Hilfe eines
linearen input-output Modells des springenden Balls und der spektralen Leistungsdichten des
Prozessrauschens, welche mit einem ersten Prototypen gemessen wurden. Die Analyse sagte
voraus, dass die Verteilung des Ballaufschlagsortes durch eine Plattenform-Optimierung nicht
signifikant verbessert werden kann. Jedoch erlaubte die Analyse, dass wir mit einer optimierten
Plattenbeschleunigung eine 27-prozentige Verbesserung der experimentellen BallsprunghöhenStandardabweichung erreichen konnten.
Mit den Resultaten, die wir mit dem BJ erreichten, haben wir den Swinging Blind Juggler
gebaut, welcher Bälle mit Hilfe eines pendelartigen Vierstab-Mechanismus zwischen zwei verschiedenen Aufschlagsorten jonglieren kann. Diese Arbeit beinhaltet eine detaillierte Analyse
des SBJ und insbesondere des Vierstab-Mechanismus. Des Weiteren präsentieren wir Jongliermaschinen, welche in Neben- und Studentenprojekten oder für Ausstellungen entwickelt wurden:
Der Cloverleaf Blind Juggler kann vier Bälle gleichzeitig jonglieren und wurde in WissenschaftsAusstellungen und -Museen gezeigt; der Circular Cloverleaf Blind Juggler kann einen Ball in
einer Kreisbewegung jonglieren auf vier geneigten Platten; und das Juggling Ensemble ist ein
Konzept für eine dynamische Installation basierend auf dem BJ.
Im zweiten Teil besprechen wir eine Strategie, welche Chaos ausnutzt zur Regelung einer Klasse von nichtlinearen Systemen, welche Symmetrien aufweisen: Diese Systeme bestehen
aus mehreren Subsystemen mit identischer Dynamik und einer gemeinsamen Stellgrösse. Diese
Symmetrie hat zur Folge, dass die Systeme nicht steuerbar sind im deterministischen Sinne:
Falls die Subsystem-Anfangszustände identisch sind, bleiben sie identisch für jegliche Stellgrössentrajektorien. Wir nutzen die Empfindlichkeit chaotischer Subsystem-Dynamik bezüglich
Prozessrauschen, welches normalerweise auf Realisationen dieser Systeme wirkt. Die lokale Instabilität chaotischer Trajektorien verstärkt das Rauschen und bewirkt, dass die Subsystem-
7
Kurzfassung
zustände schnell divergieren, was die regelungs-erschwerende Symmetrie bricht. Wenn weiter
der chaotische Attraktor der Subsysteme so entworfen wird, dass eine geeignete Überlagerung
mit den gewünschten Zielzustandsmengen der Subsysteme vorliegt, kann eine einfache Regelstrategie angewendet werden, um das Ziel zu erreichen: Warten, bis die chaotischen SubsystemTrajektorien simultan ihre jeweiligen Ziele erreichen. Diese Strategie wurde analysiert und erfolgreich angewendet in Simulation und Experimenten mit dem Cloverleaf Blind Juggler, welcher
eine geeignete Test-Plattform ist durch seine symmetrische Struktur.
Die Warte-Methode kann ineffizient sein, i.e. kann beliebig lange dauern, weil sie sich auf
das zufällige Prozessrauschen verlässt, um das Ziel zu erreichen. Deshalb wäre es vorzuziehen,
Chaos nur zu verwenden, um die Symmetrie zu brechen und anschliessend eine aktive Regelungsstrategie zu verfolgen um das System schneller ins Ziel zu bringen. Eine mögliche Methode
wird mit dem Simulation-Based LQR-Tree Algorithmus präsentiert, welcher Regelstrategien für
zustands- und stellgrössen-beschränkte nichtlineare Systeme generiert. Die Strategien können
diese Systeme von einer Anfangszustandsmenge zu einer Zielmenge stabilisieren. Eine generierte Regelstrategie besteht aus aktiv stabilisierten Systemtrajektorien, die zur Zielmenge führen.
Ein wichtiges Element der Methode ist die Annäherung der Zustandsmenge, welche von einer
stabilisierten Trajektorie ins Ziel gebracht werden kann; wir nennen diese Menge den “Funnel” einer Trajektorie. Das Generieren einer Regelstrategie, welche die Anfangszustandsmenge ins Ziel stabilisiert ist äquivalent dazu, genügend Trajektorien der Strategie hinzuzufügen,
bis die Menge durch die Funnel abgedeckt wird. Der Algorithmus erforscht die Menge mit
zufälligen Zustands-Proben und benutzt Trajektorien-Planungs-Werkzeuge um neue Trajektorien der Strategie hinzuzufügen, wo diese benötigt werden, i.e. wo die Menge noch nicht von
Funneln abgedeckt ist. Wenn schlussendliche die Strategie zur Stabilisierung eines Anfangszustands eingesetzt wird, sucht man in der Regelstrategie nach jener Trajektorie, deren Funnel den
Anfangszustand enthält; der Trajektorien-Regler wird in der Lage sein, das System erfolgreich
ins Ziel zu bringen aufgrund der Definition der Funnel.
Die Methode ist eine Variante des LQR-Tree Algorithmus’, welcher die Funnels mit Sumsof-Squares-Verifizierung annähert. In der simulations-basierten Version werden die Funnel durch
einen Falsifizierungs-Mechanismus angenähert: Jede Trajektorie hat eine Funnel-Hypothese, welche eine parametrisierte Zustandsmenge ist. Diese Hypothese wird mit den gleichen zufälligen
Zustands-Proben getestet, welche auch zur Erforschung der Anfangszustandsmenge benutzt
werden: Falls eine Probe in der Funnel-Hypothese ist, wird der entsprechende TrajektorienRegler auf die Probe angewendet in einer Simulation. Falls das System nicht das Ziel erreicht,
ist die Hypothese falsifiziert und wird entsprechend geschrumpft, so dass die Probe nicht mehr
ein Element der Hypothese ist. Mit mehr Proben schrumpft die Hypothese zu einer besseren äusseren Näherung an den wahren Funnel der Trajektorie. Der Vorteil der simulationsbasierten Variante ist, dass sie auf eine breitere Klasse von dynamischen Systemen anwendbar
ist und dass sie einfacher zu implementieren ist. Eine theoretische Analyse der asymptotischen
Algorithmus-Eigenschaften zeigte, dass der Algorithmus auf Dauer sowohl die Abdeckung als
auch die Funnel-Hypothesen verbessert. Die theoretischen Resultate konnten in Simulationen
und Experimenten mit zwei Beispielsystemen bestätigt werden: Es konnten hohe Abdeckungsund Stabilisierungs-Raten von Anfangszuständen erreicht werden. Weiter zeigten die Experimente, dass sich die Methode auf zustands- und stellgrössen-beschränkte Systeme mit schneller
Dynamik anwenden lässt.
8