Home » Ръцете на роботите могат да се сравняват с ловкостта на хората с помощта на нов изкуствен интелект, твърди Nvidia

Ръцете на роботите могат да се сравняват с ловкостта на хората с помощта на нов изкуствен интелект, твърди Nvidia

by v

Изследователите на Nvidia са постигнали голям скок в сръчността на роботите благодарение на Eureka – агент с изкуствен интелект, за който се твърди, че може да научи роботите на сложни умения, като например трикове с въртене на химикалка, толкова ловко, колкото и хората.

Новата техника, описана в статия, публикувана в четвъртък, се основава на неотдавнашните постижения в областта на големите езикови модели, като GPT-4 на OpenAI. Eureka използва генеративен ИИ за автономно писане на сложни алгоритми за възнаграждение, които позволяват на роботите да се учат чрез обучение с подсилване по метода „проба-грешка“. Този подход се оказва с над 50% по-ефективен от програмите, създадени от хора, се посочва в документа.

„Eureka също така е научила четирикраки, сръчни ръце, коботски ръце и други роботи да отварят чекмеджета, да използват ножици, да ловят топки и почти 30 различни задачи“, се казва в официална публикация в блога на Nvidia.

Eureka е най-новата демонстрация на пионерската работа на Nvidia в областта на управлението на ИИ с езикови модели. Неотдавна компанията предостави отворен код за SteerLM – метод, който настройва асистентите с изкуствен интелект да бъдат по-полезни, като ги обучава на базата на човешка обратна връзка.

Подобно на Eureka, SteerLM също използва постиженията в езиковите модели, но ги фокусира върху различно предизвикателство – подобряване на подреждането на AI асистентите. SteerLM обучава асистентите, като ги кара да практикуват разговори, подобно на робот, който се учи чрез работа. Системата дава обратна връзка за отговорите на асистента чрез атрибути като полезност, хумор и качество.

Например, това е като робот, който се учи да танцува от видеоклипове, маркирани като добри или лоши, вместо да се налага човек да преглежда хиляди случайни танци и да избира кои от тях са добри или не (което е начинът, по който се обучават типичните чатботове с изкуствен интелект). Чрез многократно практикуване и получаване на обратна връзка асистентите се научават да дават отговори, съобразени с нуждите на потребителя. Това помага ИИ да стане по-полезен за приложения в реалния свят.

Общата нишка е използването на усъвършенствани невронни мрежи по креативни нови начини, независимо дали става въпрос за обучение на роботи или чатботове. Nvidia разширява границите както на хардуерния, така и на софтуерния фронт.

За Eureka ключът беше съчетаването на технологии за симулация като тези на Айзък Гим с уменията за разпознаване на модели на езика. Eureka на практика се „учи, за да се учи“, като оптимизира собствените си алгоритми за възнаграждение в продължение на множество тренировки. Тя дори приема човешка информация, за да усъвършенства своите награди.

Този самоусъвършенстващ се подход досега се е доказал като много обобщаващ, обучавайки роботи от всякакъв вид – с крака, колела, летящи и сръчни ръце.

Eureka и SteerLM на Nvidia не просто преодоляват бариери, но и учат роботите и изкуствения интелект на изкуството на финото и проницателно взаимодействие. С всяко завъртане на писалката и остроумен разговор те чертаят бъдеще, в което ИИ не просто имитира, а прави иновации заедно с нас.

Related Posts

Leave a Comment