Een oud robotbesturingssysteem leert iets nieuws

 ‘Hoe leer je een robot om te gaan met onvoorspelbare omstandigheden zonder dat hij telkens opnieuw geprogrammeerd moet worden, met alle kosten van dien? In dit cohesieproject geven we robots generieke gereedschappen waarmee ze het zelf kunnen leren van hun menselijke collega’s.’

Het vakgebied van de robotica ontwikkelt zich razendsnel. In fabrieksomgevingen worden steeds meer robotsystemen gebruikt en tegelijkertijd ontwikkelen onderzoekers nieuwe robots die steeds meer kunnen. Twee van die onderzoekers zijn Dr. Jens Kober (Afd. Cognitive Robotics, voorheen Delft Center for Systems and Control) en Gijs van der Hoorn (Afd. Cognitive Robotics, voorheen Afd. Biomechanical Engineering). In hun cohesieproject ‘Learning-based motion control with ROS/MoveIt’ probeerden ze een component dat robots ter plekke kan laten leren te introduceren in het meest-gebruikte softwarepakket om robots te programmeren: het Robot Operating System (ROS) en het onderdeel ervan dat bewegingen plant: MoveIt!.

Omgaan met het onvoorspelbare

Robots die één voorgeprogrammeerde taak uitvoeren, zo vaak als nodig, zijn niet meer weg te denken uit de fabrieken van nu. Sterker nog, de wereldwijde verkoop van industriële robots groeit al jaren met dubbele cijfers, vooral dankzij de elektronica-industrie. Op de volgende trede van complexiteit en flexibiliteit worden robots ontwikkeld die hun omgeving kunnen aftasten en een veilige route kunnen vinden om er autonoom doorheen te bewegen. Hun vermogen om bewegingen te plannen, geeft de robots de mogelijkheid om taken uit te voeren in een willekeurige maar wel onveranderlijke omgeving. Hoewel een fascinerende ontwikkeling, is het nog mijlenver verwijderd van robots die kunnen omgaan met onvoorspelbare, bewegende obstakels – zoals bijvoorbeeld een mens die met de robot probeert samen te werken. ‘Om dat voor elkaar te krijgen, moeten robots het vermogen hebben om telkens opnieuw hun omgeving te evalueren en hun route te herberekenen, waarbij ze rekening houden met allerlei belemmeringen en onderweg ook nog eens leren.’

Plug & play

Hoewel deze uitdagingen niet nieuw zijn, wilden Kober en Van der Hoorn een schatkist aan nieuwe mogelijkheden openen door de gedroomde capaciteiten te integreren in de ROS/MoveIt! software. Omdat ROS het meest gebruikte platform is om robots te programmeren, zijn ontelbaar veel sensoren en robotsystemen al compatibel, wat uitzicht biedt op plug & play voor gebruikers over de hele wereld. ‘Helaas is MoveIt! niet goed uitgerust voor reactieve of real-time besturing.’ De twee onderzoekers vroegen softwareontwikkelaar Ir. Ruben Burger om de software-architectuur te ontwerpen.  

Flexibiliteit

De uitdaging is er een van snelle optimalisatie. ‘Wat zijn de minimale ‘kosten’ voor de robot om van A naar B te komen tegen de achtergrond van de nodige restricties?’ De robot moet een maximumsnelheid en maximale hoeken in zijn gewrichten respecteren, en niet in botsing komen met voorwerpen in de buurt. Door een softwarelaag in ROS/MoveIt! te bouwen die dit mogelijk te maakt, krijgt de robot niet alleen flexibiliteit maar ook een fundamenteel vermogen om ‘het niet te verknoeien,’ zoals Kober het omschrijft.

‘Snelle optimalisatie geeft de robot niet alleen flexibiliteit maar ook een fundamenteel vermogen om het niet te verknoeien.’

Machineleren

‘Het eerste deel van het project is succesvol afgesloten. De robot kan omgaan met veranderingen in de input of omgeving door een niet-lineair optimalisatieprobleem op te lossen binnen de reactietijd van de mens, oftewel maximaal 0,1 s. Het volgende wat we willen is om het element van het machineleren toe te voegen.’ Waarom zouden robots moeten leren om te leren? Van der Hoorn: ‘De Afdeling Biomechanical Engineering wil het graag mogelijk maken dat ook het MKB industriële robots kan veroorloven; belangrijk hiervoor is de mate waarin het systeem geprogrammeerd moet worden. We zien systemen voor ons die rechtstreeks van hun menselijke collega’s kunnen leren. Als ze daarnaast ook in staat zijn om de uitvoering van de nieuw-geleerde taken constant te optimaliseren, dan hoeft de persoon die toezicht houdt geen bijzondere vaardigheden te bezitten of uitgebreide training te volgen.’ De onderzoekers willen deze geavanceerde robotcapaciteiten zo realiseren dat ze niet beperkt zijn tot specifieke omstandigheden maar breed toepasbaar zijn.   

‘We zien systemen voor ons die rechtstreeks van hun menselijke collega’s kunnen leren en de nieuw-geleerde taken constant kunnen optimaliseren’

Complexiteit van het software-ontwerp

Nu het eenjarige cohesieproject alweer voorbij is, zullen Kober en Van der Hoorn andere fondsen moeten aanboren of gemotiveerde studenten vinden om het zelflerende aspect te ontwikkelen. ‘De implementatie van de software, net zozeer als het ontwerp, waren complexer dan verwacht,’ geeft Kober toe. ‘Mathematisch en conceptueel hadden we vrij snel bepaald wat we wilden doen. Het uitzoeken hoe we dat moesten omzetten in software, kostte meer tijd van verwacht.’ Niet onverwacht adviseert hij onderzoekers die een cohesievoorstel voorbereiden om het project zo in te richten dat het in een vroeg stadium al aantrekkelijke ‘proof of concept’ resultaten oplevert.

‘Mathematisch en conceptueel hadden we vrij snel bepaald wat we wilden doen. Het uitzoeken hoe we dat moesten omzetten in software, kostte meer tijd van verwacht.’

Cohesie-ambitie gerealiseerd

Terugkijkend concluderen de twee onderzoekers: ‘De samenwerking tussen het Center for Systems and Control en de Afdeling Biomechanical Engineering was sowieso al niet vergezocht; we werken allebei op het grensvlak van hoe robots bewegen en hoe mensen dat doen. De algehele cohesie is al zichtbaar uit de onderzoeksonderwerpen zoals robots die mensen helpen bewegen of robotbewegingen geïnspireerd op hoe mensen bewegen.’ Sterker nog, tijdens cohesieproject werd een nieuwe afdeling Cognitive Robotics opgericht, bemenst door onderzoekers uit beide disciplines, waaronder Kober en Van der Hoorn zelf. Kortom: cohesie-ambitie gerealiseerd. 

Dr. Jens Kober (Afd. Cognitive Robotics, voorheen Delft Center for Systems and Control) is universitair docent en onderzoeker aan de TU Delft. Daarvoor werkte hij als postdoc aan zowel de Universiteit van Bielefeld en het Honda Research Institute Europe, allebei in Duitsland. Hij promoveerde in 2012 aan de Technische Universiteit Darmstadt, waarbij hij de prijs voor het beste roboticaproefschrift van Europa won. Hij is expert op het gebied van robotica en verschillende soorten machineleren zoals reinforcement, imitation en deep learning.

Ir. Gijs van der Hoorn (Afd. Cognitive Robotics, voorheen Afd. Biomechanical Engineering) is onderzoeker in de Robot Dynamics group van de afdeling CoR van de TU Delft. Hij behaalde zijn Master of Science diploma in Computer Science aan de TU Delft in 2012. Hij is o.a. geïnteresseerd in softwareontwerp in experimentele-roboticacontext, industriële robotica en productieautomatisering.