Výzkumníci společnosti Nvidia dosáhli velkého skoku v obratnosti robotů díky agentu umělé inteligence Eureka, který údajně dokáže naučit roboty složitým dovednostem, jako jsou triky s otáčením pera, stejně obratně jako lidé.
Nová technika, popsaná v článku zveřejněném ve čtvrtek, vychází z nedávných pokroků v oblasti velkých jazykových modelů, jako je GPT-4 společnosti OpenAI. Eureka využívá generativní umělou inteligenci k autonomnímu zápisu sofistikovaných algoritmů odměňování, které umožňují robotům učit se prostřednictvím posilovacího učení metodou pokus-omyl. Tento přístup se ukázal být o více než 50 % účinnější než programy vytvořené lidmi, uvádí se v článku.
„Eureka také naučila čtyřnožce, šikovné ruce, ruce kobotů a další roboty otevírat zásuvky, používat nůžky, chytat míče a téměř 30 různých úkolů,“ uvádí se v oficiálním příspěvku na blogu společnosti Nvidia.
Eureka je nejnovější ukázkou průkopnické práce společnosti Nvidia v oblasti řízení umělé inteligence pomocí jazykových modelů. Nedávno společnost otevřela SteerLM – metodu, která přizpůsobuje asistenty AI tak, aby byli užitečnější tím, že je trénuje na základě lidské zpětné vazby.
Podobně jako Eureka, i SteerLM využívá pokroky v jazykových modelech, ale zaměřuje je na jiný úkol – zlepšení sladění asistentů AI. SteerLM trénuje asistenty tím, že je nechává cvičit konverzace, podobně jako se robot učí praxí. Systém poskytuje zpětnou vazbu o odpovědích asistenta prostřednictvím atributů, jako je vstřícnost, humor a kvalita.
Je to například jako když se robot učí tančit z videí označených jako dobré nebo špatné, místo aby člověk prohlížel tisíce náhodných tanců a vybíral, které jsou dobré a které ne (což je způsob, jakým se trénují typičtí chatboti s umělou inteligencí). Opakovaným cvičením a získáváním zpětné vazby se asistenti učí poskytovat odpovědi přizpůsobené potřebám uživatele. Díky tomu je umělá inteligence přínosnější pro reálné aplikace.
Společným znakem je využití pokročilých neuronových sítí novými kreativními způsoby, ať už jde o výuku robotů nebo chatbotů. Společnost Nvidia posouvá hranice na poli hardwaru i softwaru.
Pro společnost Eureka bylo klíčové spojení simulačních technologií, jako jsou ty od Isaaca Gym, se schopnostmi rozpoznávání vzorů jazykových modelů. Eureka se efektivně „učí, aby se učila“, a optimalizuje své vlastní algoritmy odměňování v průběhu několika tréninkových běhů. Dokonce přijímá i lidské vstupy, aby své odměny vylepšila.
Tento sebezdokonalující se přístup se zatím ukázal jako vysoce zobecnitelný a umožňuje trénovat roboty všeho druhu – nohaté, kolečkové, létající i obratné ruce.
Systémy Eureka a SteerLM od společnosti Nvidia nejen překonávají bariéry, ale učí roboty a umělou inteligenci umění jemné a pronikavé interakce. Každým otočením pera a vtipným rozhovorem načrtávají budoucnost, v níž AI nebude jen napodobovat, ale inovovat spolu s námi.