DISS. ETH NO. 22838 Sensorless Juggling Machines and Chaos for Control A thesis submitted to attain the degree of DOCTOR OF SCIENCES of ETH ZURICH (Dr. sc. ETH Zurich) presented by Philipp Sebastian Reist M.Sc. ETH in Mechanical Engineering born on 27. July 1982 citizen of Sumiswald, BE accepted on the recommendation of Prof. Dr. Raffaello D’Andrea, examiner Prof. Dr. Russ Tedrake, co-examiner Prof. Dr. Jonas Buchli, co-examiner 2015 Abstract This thesis presents two main topics: A) The design and analysis of sensorless juggling machines; and B) the development of control strategies for a class of nonlinear dynamic systems. In the first part, contributions to the field of robotic juggling are made that push the boundary of what is possible in sensorless, robotic juggling of unconstrained balls. Specifically, we present the Blind Juggler (BJ) that can continuously bounce balls at heights of up to two meters without sensors detecting the ball. The key design parameters that provide local, open-loop stability to the ball trajectory are a concave, parabolic shape of the paddle that is used to strike the ball, and the paddle’s acceleration at nominal ball impact time. The stabilizing parameters were determined with a local stability analysis of the ball trajectory, and were then further refined to optimize juggling performance in an H2 -sense: The apex-height and impact-location standard deviations were predicted using a linear input-output model of the bouncing ball together with process-noise power spectral densities measured with a first prototype. While the analysis predicted that the impact-location distribution cannot be significantly improved by optimizing the paddle curvature, it allowed us to achieve a 27%-improvement in experimental apex-height standard deviation with an optimized paddle acceleration. With the results obtained with the BJ, we built the Swinging Blind Juggler (SBJ), which can bounce a ball in a side-to-side motion with the actuated paddle mounted to a swinging, pendulum-like four-bar linkage. The thesis includes the detailed analysis and design of the SBJ, and specifically its four-bar linkage. We further briefly introduce juggling machines that were developed in side- and student-projects, and for outreach purposes: The Cloverleaf Blind Juggler can simultaneously juggle four balls and has been rented out to science exhibitions and museums; the Circular Cloverleaf Blind Juggler can bounce a ball in a circular fashion on four tilted paddles; and the Juggling Ensemble is a concept for a dynamic installation based on the BJ. In the second part, we introduce a strategy for exploiting chaos to control a class of nonlinear systems that have a symmetric structure: The systems are composed of subsystems with identical dynamics with a common control input. This symmetric structure renders the systems uncontrollable in a deterministic sense, if the initial conditions of their subsystems are identical: The subsystem-states remain identical irrespective of the applied control input. We exploit the sensitivity of chaotic system dynamics to small 5 Abstract disturbances that are typically present in physical realizations of the systems. The local instability of chaotic trajectories amplifies these disturbances and causes the subsystemstates to diverge quickly, breaking the symmetry that makes control challenging. Furthermore, if the chaotic attractor underlying the chaotic subsystem dynamics is designed to overlap appropriately with the respective subsystem goals, a straightforward strategy can be applied to drive the overall system state to the goal: Wait until the chaotic subsystem trajectories simultaneously reach the respective subsystem goals. This approach was analyzed, and successfully applied both in simulation and experiments with the Cloverleaf Blind Juggler as a test-bed, since it features a suitable symmetric structure. The waiting approach can be inefficient, i.e. can take arbitrarily long, since it relies on random disturbances to drive the system to the goal. Therefore, it would be desirable to only use chaos to break a possible symmetry in the system’s initial condition, and then apply feedback-control to more quickly reach the goal. A possible approach is presented with the Simulation-Based LQR-Tree algorithm, which generates control policies that stabilize state- and input-constrained nonlinear systems to a goal from a set of initial conditions. A generated policy consists of a set of feedback-stabilized trajectories that lead to the goal. Key to the approach is the approximation of the set of states that can be stabilized to the goal by a trajectory’s feedback-policy; this set is called the “funnel” of the trajectory. Generating a policy that can stabilize a set of initial conditions to the goal is equivalent to adding trajectories to the policy until their funnels cover the set. The algorithm explores the set using random sampling, and uses motion-planning to add trajectories to the policy where needed, i.e. where coverage by funnels is not yet provided. Finally, when the generated policy is deployed, the set of trajectories is queried for the trajectory whose funnel contains a given initial condition, and the determined trajectory-policy is able to stabilize the initial condition by definition of the funnels. The algorithm is a variant of the original LQR-Tree algorithm, where funnels are approximated using sums-of-squares verification. In the simulation-based version, the funnels are approximated with a falsification mechanism: Each trajectory has an associated funnel-hypothesis, which is a parametrized set of states. These funnel-hypotheses are tested with the same random state samples used to explore the set of initial conditions: If a sample is in a hypothesis, the trajectory’s feedback policy is applied to the sample in a simulation. If the system fails to stabilize to the goal, the hypothesis is falsified and shrunk to exclude the sample. With more samples, the hypothesis shrinks to a better outer-approximation of the trajectory’s stabilizable set. The advantages of the simulation-based variant over the original LQR-Tree algorithm are that it is applicable to a broader class of systems, and that it is more straightforward to implement. A theoretical analysis of the asymptotic properties of the algorithm showed that in the long run, the algorithm tends to improve both coverage and funnel hypotheses of the policy. The theoretical findings are supported by simulation and experimental results with example nonlinear systems, where we achieved high coverage- and stabilizability-rates of initial conditions, and which demonstrated the applicability of the approach to state- and input-constrained, highly-dynamic systems. 6 Kurzfassung In dieser Arbeit werden zwei Themen behandelt: 1) Das Design und die Analyse von sensorlosen Jongliermaschinen und 2) die Entwicklung von Regelstrategien für eine Klasse von nichtlinearen dynamischen Systemen. Im ersten Teil werden Beiträge im Gebiet des robotischen Jonglierens gemacht, welche Fortschritte darstellen im sensorlosen, robotischen Jonglieren von sich frei bewegenden Bällen. Dazu stellen wir den Blind Juggler (BJ) vor, welcher ununterbrochen Bälle mit einer Sprunghöhe von bis zu zwei Metern jonglieren kann; und dies ohne jegliche Sensoren, um die Bälle zu detektieren. Die Schlüsselparameter, die eine mit offenem Regelkreis erzielbare lokale Stabilität der Balltrajektorie ermöglichen, sind eine konkave, parabolische Form der Jonglierplatte und deren Beschleunigung beim nominellen Ballaufschlagszeitpunkt. Die stabilisierenden Parameter wurden zuerst in einer lokalen Stabilitätsanalyse der Balltrajektorie bestimmt und anschliessend optimiert, um die Jonglier-Performance zu verbessern in einem H2 -Sinne: Die Standardabweichungen der Ballsprunghöhe und des Aufschlagsortes wurden berechnet mit Hilfe eines linearen input-output Modells des springenden Balls und der spektralen Leistungsdichten des Prozessrauschens, welche mit einem ersten Prototypen gemessen wurden. Die Analyse sagte voraus, dass die Verteilung des Ballaufschlagsortes durch eine Plattenform-Optimierung nicht signifikant verbessert werden kann. Jedoch erlaubte die Analyse, dass wir mit einer optimierten Plattenbeschleunigung eine 27-prozentige Verbesserung der experimentellen BallsprunghöhenStandardabweichung erreichen konnten. Mit den Resultaten, die wir mit dem BJ erreichten, haben wir den Swinging Blind Juggler gebaut, welcher Bälle mit Hilfe eines pendelartigen Vierstab-Mechanismus zwischen zwei verschiedenen Aufschlagsorten jonglieren kann. Diese Arbeit beinhaltet eine detaillierte Analyse des SBJ und insbesondere des Vierstab-Mechanismus. Des Weiteren präsentieren wir Jongliermaschinen, welche in Neben- und Studentenprojekten oder für Ausstellungen entwickelt wurden: Der Cloverleaf Blind Juggler kann vier Bälle gleichzeitig jonglieren und wurde in WissenschaftsAusstellungen und -Museen gezeigt; der Circular Cloverleaf Blind Juggler kann einen Ball in einer Kreisbewegung jonglieren auf vier geneigten Platten; und das Juggling Ensemble ist ein Konzept für eine dynamische Installation basierend auf dem BJ. Im zweiten Teil besprechen wir eine Strategie, welche Chaos ausnutzt zur Regelung einer Klasse von nichtlinearen Systemen, welche Symmetrien aufweisen: Diese Systeme bestehen aus mehreren Subsystemen mit identischer Dynamik und einer gemeinsamen Stellgrösse. Diese Symmetrie hat zur Folge, dass die Systeme nicht steuerbar sind im deterministischen Sinne: Falls die Subsystem-Anfangszustände identisch sind, bleiben sie identisch für jegliche Stellgrössentrajektorien. Wir nutzen die Empfindlichkeit chaotischer Subsystem-Dynamik bezüglich Prozessrauschen, welches normalerweise auf Realisationen dieser Systeme wirkt. Die lokale Instabilität chaotischer Trajektorien verstärkt das Rauschen und bewirkt, dass die Subsystem- 7 Kurzfassung zustände schnell divergieren, was die regelungs-erschwerende Symmetrie bricht. Wenn weiter der chaotische Attraktor der Subsysteme so entworfen wird, dass eine geeignete Überlagerung mit den gewünschten Zielzustandsmengen der Subsysteme vorliegt, kann eine einfache Regelstrategie angewendet werden, um das Ziel zu erreichen: Warten, bis die chaotischen SubsystemTrajektorien simultan ihre jeweiligen Ziele erreichen. Diese Strategie wurde analysiert und erfolgreich angewendet in Simulation und Experimenten mit dem Cloverleaf Blind Juggler, welcher eine geeignete Test-Plattform ist durch seine symmetrische Struktur. Die Warte-Methode kann ineffizient sein, i.e. kann beliebig lange dauern, weil sie sich auf das zufällige Prozessrauschen verlässt, um das Ziel zu erreichen. Deshalb wäre es vorzuziehen, Chaos nur zu verwenden, um die Symmetrie zu brechen und anschliessend eine aktive Regelungsstrategie zu verfolgen um das System schneller ins Ziel zu bringen. Eine mögliche Methode wird mit dem Simulation-Based LQR-Tree Algorithmus präsentiert, welcher Regelstrategien für zustands- und stellgrössen-beschränkte nichtlineare Systeme generiert. Die Strategien können diese Systeme von einer Anfangszustandsmenge zu einer Zielmenge stabilisieren. Eine generierte Regelstrategie besteht aus aktiv stabilisierten Systemtrajektorien, die zur Zielmenge führen. Ein wichtiges Element der Methode ist die Annäherung der Zustandsmenge, welche von einer stabilisierten Trajektorie ins Ziel gebracht werden kann; wir nennen diese Menge den “Funnel” einer Trajektorie. Das Generieren einer Regelstrategie, welche die Anfangszustandsmenge ins Ziel stabilisiert ist äquivalent dazu, genügend Trajektorien der Strategie hinzuzufügen, bis die Menge durch die Funnel abgedeckt wird. Der Algorithmus erforscht die Menge mit zufälligen Zustands-Proben und benutzt Trajektorien-Planungs-Werkzeuge um neue Trajektorien der Strategie hinzuzufügen, wo diese benötigt werden, i.e. wo die Menge noch nicht von Funneln abgedeckt ist. Wenn schlussendliche die Strategie zur Stabilisierung eines Anfangszustands eingesetzt wird, sucht man in der Regelstrategie nach jener Trajektorie, deren Funnel den Anfangszustand enthält; der Trajektorien-Regler wird in der Lage sein, das System erfolgreich ins Ziel zu bringen aufgrund der Definition der Funnel. Die Methode ist eine Variante des LQR-Tree Algorithmus’, welcher die Funnels mit Sumsof-Squares-Verifizierung annähert. In der simulations-basierten Version werden die Funnel durch einen Falsifizierungs-Mechanismus angenähert: Jede Trajektorie hat eine Funnel-Hypothese, welche eine parametrisierte Zustandsmenge ist. Diese Hypothese wird mit den gleichen zufälligen Zustands-Proben getestet, welche auch zur Erforschung der Anfangszustandsmenge benutzt werden: Falls eine Probe in der Funnel-Hypothese ist, wird der entsprechende TrajektorienRegler auf die Probe angewendet in einer Simulation. Falls das System nicht das Ziel erreicht, ist die Hypothese falsifiziert und wird entsprechend geschrumpft, so dass die Probe nicht mehr ein Element der Hypothese ist. Mit mehr Proben schrumpft die Hypothese zu einer besseren äusseren Näherung an den wahren Funnel der Trajektorie. Der Vorteil der simulationsbasierten Variante ist, dass sie auf eine breitere Klasse von dynamischen Systemen anwendbar ist und dass sie einfacher zu implementieren ist. Eine theoretische Analyse der asymptotischen Algorithmus-Eigenschaften zeigte, dass der Algorithmus auf Dauer sowohl die Abdeckung als auch die Funnel-Hypothesen verbessert. Die theoretischen Resultate konnten in Simulationen und Experimenten mit zwei Beispielsystemen bestätigt werden: Es konnten hohe Abdeckungsund Stabilisierungs-Raten von Anfangszuständen erreicht werden. Weiter zeigten die Experimente, dass sich die Methode auf zustands- und stellgrössen-beschränkte Systeme mit schneller Dynamik anwenden lässt. 8
© Copyright 2024 ExpyDoc