What the aibos could learn from the midsize league Overview of past research activities at the University of Amsterdam Speaker Jürgen Sturm
Overview Midsize soccer league Midsize soccer league Onderzoek UvA Onderzoek UvA Team gebaseerde gedragsselectie Team gebaseerde gedragsselectie Particle filters voor lokalisatie Particle filters voor lokalisatie
Midsize league
Midsize league – 4 legged league Nomad Scout Aibo Diameter x Height 41 cm x 60 cm 25 cm x 30 cm Payload / Weight 5 kg / 25 kg - / 2 kg Battery power/duration 300 WH / 1 h 10 WH / 1.5 h Max. speed 1 m/s 30 cm/s Hardware Pentium 233 MHz WLAN 64bit RISC 567 MHz WLAN SoftwareHDD RedHat Linux MemoryStickAperios
Team based Action planning Master project of Matthijs Spaan
Clockwork Orange Architecture Sense-Think-Act
Team based Action planning World model Robot, Teamgenoten Robot, Teamgenoten Tegenstanders Tegenstanders Bal Bal Player skills: Turn Move Dribble Shoot Seek Chase
Team based Action planning Het balbezit bepaald de team strategie Het balbezit bepaald de team strategie Wij balbezit → Attack Wij balbezit → Attack Zij balbezit → Defend Zij balbezit → Defend Niemand balbezit → Intercept Niemand balbezit → Intercept De team strategie is algemeen, oftewel hetzelfde voor alle teamgenoten De team strategie is algemeen, oftewel hetzelfde voor alle teamgenoten
Team based Action planning Dynamische rolallocatie Om in te schatten wat de optimale rolverdeling is, zijn er verschillende evaluatie functies gemaakt, met als variabelen: Tijd benodigd om bij de bal te komen Tijd benodigd om bij de bal te komen Huidige positie Huidige positie Balbezit Balbezit
Team based Action planning Resultaten Rolverdeling kwart- finale Rolverdeling kwart- finale CS Freiburg Team Strategie 2001 Team Strategie 2001 Seattle Seattle
Team based Action planning Resultaten Actieverdeling kwart-finale Actieverdeling kwart-finale
Particle filters for localisation
Markov State World States World States Sensor Readings Sensor Readings Actions Actions Action Model Action Model Sensor Model Sensor Model
Markov State Estimation Markov State Estimation Markov State Estimation Problem: how to represent efficiently a probability distribution? Problem: how to represent efficiently a probability distribution? Monte-Carlo solution Monte-Carlo solution Particle distribution
Particle filtering Particle filters is een Monte Carlo methode Particle filters is een Monte Carlo methode Houdt een aantal hypothesen bij mbv particles Houdt een aantal hypothesen bij mbv particles De waarschijnlijkheid distributie kan hierbij een willekeurige vorm hebben. De waarschijnlijkheid distributie kan hierbij een willekeurige vorm hebben. prior distribution apply action and sensor model select most likely hypothesis by random sampling on weight (posterior distribution)
Particle filtering Particle Filter moet robuust zijn tegen verstoringen Particle Filter moet robuust zijn tegen verstoringen Alle particles fout, sensor model correct (kidnap) Alle particles fout, sensor model correct (kidnap) sensor model fout, particles correct (noise, outlier) sensor model fout, particles correct (noise, outlier) Allebei fout Allebei fout Kidnapper-noise dilemma Kidnapper-noise dilemma Noise vaak tijdelijk gecorreleerd Noise vaak tijdelijk gecorreleerd
Particle filtering Solutions to the kidnapper-noise dilemma Solutions to the kidnapper-noise dilemma Re-sample strategy Re-sample strategy Re-sample all particles from scratch after a given period without overlap (“reset” by a watchdog) Re-sample all particles from scratch after a given period without overlap (“reset” by a watchdog) Sample-from-likelihood Sample-from-likelihood Sample part of the new particles directly from the sensor data Sample part of the new particles directly from the sensor data
Particle filtering Solution: Coherence t: t+1: t+2: t+4: t+3: initiëren rechtstreeks uit de metingen een kleine subset initiëren rechtstreeks uit de metingen een kleine subset nieuwe particle eigenschap: coherence nieuwe particle eigenschap: coherence De nieuwe set van particles wordt samengesteld mbv de eigenschappen: De nieuwe set van particles wordt samengesteld mbv de eigenschappen: weight, likelihood en coherence weight, likelihood en coherence MaxCoherence kan gebruikt worden om het conservatisme in te stellen MaxCoherence kan gebruikt worden om het conservatisme in te stellen Korte periode van twijfel bij consistente verstoringen Korte periode van twijfel bij consistente verstoringen
Particle filtering Experimenten met een 1-D gesimuleerde omgeving Experimenten met een 1-D gesimuleerde omgeving 3 scenarios 3 scenarios kidnap kidnap Korte periode (4 tijdstappen) van consistent foute metingen Korte periode (4 tijdstappen) van consistent foute metingen Langere periode (20 tijdstappen) van willekeurige foute metingen Langere periode (20 tijdstappen) van willekeurige foute metingen 5 particle filter configuraties 5 particle filter configuraties normal normal reinitialize reinitialize sample from likelihood sample from likelihood coherence with maxCoherence=5 coherence with maxCoherence=5 coherence with maxCoherence=15 coherence with maxCoherence=15
Particle filtering Results Coherence PF test de consistentie van alternatieve hypothesen, en veranderd gelijkmatig zijn aannames Coherence PF test de consistentie van alternatieve hypothesen, en veranderd gelijkmatig zijn aannames Coherence PF is nooit de slechtste oplossing Coherence PF is nooit de slechtste oplossing Het conservatisme is goed in te stellen met Cmax Het conservatisme is goed in te stellen met Cmax
Conclusion Robot toepassingen hebben vaak vergelijkbare problemen Robot toepassingen hebben vaak vergelijkbare problemen Er is bij de UvA (en TUD) veel ervaring met problemen zoals: Er is bij de UvA (en TUD) veel ervaring met problemen zoals: Gedrag selectie en coördinatie Gedrag selectie en coördinatie Lokalisatie Lokalisatie