Forestil dig fremtiden hvor flåder af selvstyrende og gensidigt forbundne robotter vil kunne lære og forbedre sig selv i realtid med en smule hjælp af menneskelig intervention; Velkommen til verdenen af Interactive Fleet Learning!
Da robotteknologi bevægede sig fra laboratoriebænkene til den virkelige verden, så vi eksempler som selvkørende biler fra Waymo, Amazon’s e-handelsrobotter og Kiwibots madleverings-robotter. Alt dette skyldtes implementeringen af Interactive Fleet Learning (IFL), der gør det muligt for store robotflåder at operere autonomt og endnu mere effektivt.
“Ved at samle data fra alle robotter i flåden kan de effektivt lære af hver enkelt robots erfaringer.”
En af de mest fordelagtige tilgange til at forbedre robotflådens effektivitet er brugen af cloud-robotteknologi. Dette gør det muligt for flåden at overføre deres data, hukommelse og beregninger til skyen via internettet. Men dette system er ikke uden udfordringer, specielt når det man kalder ‘Long Tail’-problemer, hvor robotflåden skal håndtere uventede scenarier eller edge cases, ikke er repræsenteret i datasættet.
Svaret på disse udfordringer kan være fundet med paradigmet Interactive Fleet Learning. IFL introducerer konceptet om ‘on demand’-overvågning, hvilket betyder at hver robot i flåden kan anmoder om vejledning fra et menneske, når de støder på edge-cases, som ellers ville betyde at robotten stoppede sin rutine eller opgaver helt.
For at standardisere og lette evalueringen af nye IFL-algoritmer, har forskere introduceret et open-source Python-værktøj kaldet IFL Benchmark. Dette værktøj giver forskere muligheden for at udføre samtidige forsøg og evaluere forskellige IFL-algoritmer.
Et særligt IFL-algoritme eksempel er Fleet-DAgger. Det anvender interaktiv imitation learning og prioriterer robotter baseret på en unik prioriteringsfunktion. Dette fører til at de robotter med højere prioritet har større sandsynlighed for at modtage menneskelig opmærksomhed. Så de robotter, der befinder sig i særligt udfordrende miljøer, får nemmere adgang til hjælp, hvorefter instrukserne til løsning af problemet nedarves til resten af flåden. Forestil dig robotten, der kører fast i mudder. Robotten ved den ikke kan flytte sig of anmoder derfor om hjælp. Den menneskelige robot-operatør overtager, og styrer robotten tilbage ved at dreje fra side til side imens den bakker. Roboternes fælles neurale netværk efterligner robot-operatørens instrukser i en simulering og finder den mest effektive måde at komme fri fra mudderpølen. Instrukserne nedarves til alle robotter i flåden, og nu kører robotterne fri af mudderpøle verden over.
“IFL-paradigmet tilbyder en vej fremad, som skalerer læring med superviserede robotter og pålideligt implementere robotflåder i hverdagens verden.”
IFL viser stort potentiale for at fremskynde implementeringen af robotflåder i forskellige industrier. Bekvemmeligheden ved at kunne anvende sikre, pålidelige og kontinuerlig forbedring gennem menneskelig intervention og maskinindlæring er stor og kan føre til endnu et kvantespring for automatisering af fysiske robotter. I den humoristiske ånd kan man sige at det er som at give robotterne en fælles hjernetræning. Men det er kun begyndelsen, og der er mange andre interessante forskningsretninger at udforske i robotflådelæringens verden.