Toyota står i spidsen for et nyt banebrydende initiativ til at træne AI-udstyrede morgenmadsbots inden for det, de kalder en "børnehave for robotter."
Selvom disse robotter måske endnu ikke mestrer komplekse kulinariske bedrifter som at lave en frittata, kan de dygtigt håndtere opgaver som at piske æg. Toyota Research Institute (TRI) opnåede denne bedrift uden den sædvanlige omfattende kodning, fejlkorrektion og fejlretning. I stedet indgydte de robotterne med en følelse af berøring, integrerede dem med en AI-model og instruerede dem meget ligesom man ville lære et menneske.
Toyota Research Institute
Denne taktile evne står som et afgørende fremskridt, ifølge forskerne. Gennem inkorporeringen af et væsentligt, formbart vedhæng (her omtalt som en "stor, pudeagtig tommelfinger"), opnår modellen en taktil forståelse af dens handlinger, hvilket væsentligt forbedrer dens dygtighed. Ben Burchfiel, laboratoriets ekspert i fingernem manipulation, udtrykte begejstring over at se robotterne interagere med deres omgivelser. Processen starter med, at en "lærer" demonstrerer et sæt færdigheder, og efterfølgende assimilerer modellen denne information over et tidsrum i baggrunden. Burchfiel bemærker endvidere, at det er rutine for dem at instruere en robot om eftermiddagen, tillade den at lære natten over og ankomme den følgende morgen for at overvære en nyligt erhvervet funktionalitet.
Large Behavior Models v. Large Breakfast Models
Forskerne bestræber sig på at udvikle "Large Behavior Models" (omtalt i daglig tale som LBM'er og håbede humoristisk at stå for Large Breakfast Models). Disse modeller, der afspejler træningen af store sprogmodeller (LLM'er) baseret på menneskelige skrivemønstre, ville lære gennem observation og efterfølgende anvende denne viden til at udføre helt nye opgaver, de aldrig eksplicit er blevet undervist i. Russ Tedrake, en MIT-robotikprofessor og VP for robotforskning ved TRI, uddybede denne tilgang.
Ved at bruge denne metode har forskerne med succes trænet over 60 indviklede færdigheder, herunder opgaver som at hælde væsker, bruge værktøjer og manipulere formbare genstande. Deres ambition er at eskalere dette tal til 1.000 inden udgangen af 2024.
Parallelt med Toyotas indsats har Google og Tesla påbegyndt lignende forskningsbestræbelser med deres respektive robotplatforme, såsom Robotic Transformer (RT-2). Disse robotter udnytter deres akkumulerede erfaringer til at udlede, hvordan man udfører opgaver.
I teorien kunne robotter trænet af AI i sidste ende udføre opgaver med minimal vejledning, svarende til de generelle anvisninger, man kan give et menneske ("rens det spild," for eksempel).
Ikke desto mindre har Googles robotter, som bemærket af The New York Times, en betydelig afstand at tilbagelægge i denne bestræbelse. The Times fremhæver, at sådanne virksomheder typisk er karakteriseret ved en langvarig og arbejdskrævende proces, og at tilvejebringe passende træningsdata viser sig at være betydeligt mere udfordrende end blot at tilføre en AI-model rigelige mængder data fra internettet. Dette er eksemplificeret ved et tilfælde, hvor en robot fejlagtigt identificerede en banans farve som hvid.
Comments