Ten robot napędzany sztuczną inteligencją działa dalej, nawet jeśli atakujesz go piłą łańcuchową

Czworonożny robot, który nadal się porusza, mimo że wszystkie cztery jego nogi zostały odcięte piłą łańcuchową, jest dla większości ludzi koszmarem.
Dla Deepaka Pathaka, współzałożyciela i dyrektora generalnego startupu Skild AI, dystopijny wyczyn adaptacyjny jest zachęcającym sygnałem, że powstaje nowy, bardziej powszechny rodzaj inteligencji robotów.
„To coś, co nazywamy mózgiem wielocielesnym” – mówi mi Pathak. Jego startup opracował ogólny algorytm sztucznej inteligencji , aby sprostać kluczowemu wyzwaniu postępującej robotyki: „Dowolny robot, dowolne zadanie, jeden mózg. To absurdalnie ogólne”.
Wielu badaczy uważa, że modele sztucznej inteligencji wykorzystywane do sterowania robotami mogą zrobić ogromny krok naprzód, podobny do tego, który miał miejsce w przypadku modeli językowych i chatbotów, jeśli uda się zebrać wystarczającą ilość danych szkoleniowych.
Robot sterowany przez sztuczną inteligencję jest w stanie przystosować się do nowych, ekstremalnych okoliczności, takich jak utrata kończyn.
Jak twierdzi Pathak, istniejące metody szkolenia modeli sztucznej inteligencji robotów, takie jak uczenie algorytmów sterowania konkretnym systemem za pomocą teleoperacji lub symulacji, nie generują wystarczającej ilości danych.
Podejście Skilda polega na tym, że jeden algorytm uczy się kontrolować dużą liczbę różnych robotów fizycznych w szerokim zakresie zadań. Z czasem powstaje model, który firma nazywa Skild Brain, z bardziej ogólną zdolnością adaptacji do różnych form fizycznych – w tym tych, których nigdy wcześniej nie widziała. Naukowcy stworzyli mniejszą wersję modelu, zwaną LocoFormer, na potrzeby publikacji naukowej opisującej to podejście.
Model został również zaprojektowany tak, aby szybko adaptować się do nowej sytuacji, takiej jak brak nogi lub zdradliwy nowy teren, i uczyć się, jak zastosować zdobytą wiedzę w nowej sytuacji. Pathak porównuje to podejście do sposobu, w jaki duże modele językowe radzą sobie ze szczególnie trudnymi problemami, rozkładając je na czynniki pierwsze i wprowadzając swoje rozważania z powrotem do własnego okna kontekstowego – podejście znane jako uczenie się w kontekście.
Inne firmy, w tym Toyota Research Institute i konkurencyjny startup o nazwie Physical Intelligence , również ścigają się w opracowywaniu bardziej uniwersalnych modeli sztucznej inteligencji robotów. Skild jest jednak nietypowy, ponieważ tworzy modele, które można uogólnić na tak wiele różnych rodzajów sprzętu.
LocoFormer jest trenowany z wykorzystaniem uczenia maszynowego na dużą skalę na różnorodnych robotach generowanych proceduralnie z agresywną randomizacją domen.
Dzięki uprzejmości SkildW jednym z eksperymentów zespół Skilda wytrenował swój algorytm do sterowania dużą liczbą kroczących robotów o różnych kształtach. Po uruchomieniu algorytmu na prawdziwych robotach dwu- i czteronożnych – systemach nieuwzględnionych w danych treningowych – był on w stanie kontrolować ich ruchy i sprawić, by chodziły.
W pewnym momencie zespół odkrył, że czteronożny robot zarządzający wieloczęściowym mózgiem firmy szybko adaptuje się, gdy zostanie postawiony na tylnych łapach. Ponieważ robot wyczuwa podłoże pod tylnymi łapami, algorytm kieruje nim jak humanoidem, każąc mu chodzić na tylnych łapach.
LocoFormer nieustannie uczy się dzięki doświadczeniom online. Polityka może wyciągać wnioski z upadków we wczesnych próbach, aby udoskonalić strategie kontroli w późniejszych.
Dzięki uprzejmości SkildAlgorytm generalistyczny mógł również adaptować się do ekstremalnych zmian kształtu robota – na przykład gdy jego nogi były ze sobą związane, odcięte lub modyfikowane w celu wydłużenia. Zespół próbował również dezaktywować dwa silniki w czworonożnym robocie z kołami i nogami. Robot był w stanie adaptować się, utrzymując równowagę na dwóch kołach, niczym niestabilny rower.
W obliczu poważnych zakłóceń — takich jak zmiany morfologiczne, awarie motoryczne lub zmiany wagi — LocoFormer może przebudować takie reprezentacje, aby osiągnąć adaptację online.
Dzięki uprzejmości SkildSkild testuje to samo podejście do manipulacji robotami. Wyszkolił Skild Brain na szeregu symulowanych ramion robotycznych i odkrył, że powstały model potrafi kontrolować nieznany sprzęt i adaptować się do nagłych zmian w otoczeniu, takich jak zmniejszenie oświetlenia. Jak mówi Pathak, startup współpracuje już z kilkoma firmami wykorzystującymi ramiona robotów. W 2024 roku firma pozyskała 300 milionów dolarów w rundzie finansowania, która wyceniła ją na 1,5 miliarda dolarów.
Pathak mówi, że wyniki mogą niektórym wydawać się przerażające, ale dla niego pokazują one iskry jakiejś fizycznej superinteligencji robotów. „Dla mnie osobiście to takie ekscytujące, stary” – mówi.
Co sądzisz o wszechstronnym mózgu robota Skilda? Wyślij mi wiadomość e-mail na adres [email protected] .
To jest wydanie biuletynu AI Lab Willa Knighta . Przeczytaj poprzednie biuletyny tutaj.
wired