Home » A mão de um robô rivaliza com a destreza humana graças a uma nova inteligência artificial, afirma a Nvidia.

A mão de um robô rivaliza com a destreza humana graças a uma nova inteligência artificial, afirma a Nvidia.

by Tim

A nova tecnologia, descrita num artigo publicado na quinta-feira, baseia-se em avanços recentes em modelos de linguagem em grande escala, como o GPT-4 OpenAI. O Eureka utiliza a inteligência artificial generativa para permitir que os robôs aprendam através da aprendizagem por reforço de tentativa e erro, com algoritmos de recompensa avançados que os descrevem de forma autónoma. descrevem de forma autónoma. Esta abordagem revelou-se 50% mais eficaz do que os programas gerados por humanos, tal como descrito no artigo.

“O Eureka também ensinou mãos hábeis de quatro patas, braços cobot e outros robots a abrir gavetas, utilizar tesouras, apanhar bolas e cerca de 30 outras tarefas”, afirma o – A publicação no blogue oficial da Nvidia diz o seguinte.

O

Eureka é a mais recente demonstração do trabalho pioneiro da Nvidia no controlo da inteligência artificial com modelos de linguagem. A empresa lançou recentemente o SteerLM, uma técnica para personalizar os assistentes de IA de forma a serem mais úteis, treinando-os com base no feedback humano.

Tal como o Eureka, o SteerLM utiliza avanços na modelação da linguagem, mas centra-se no desafio diferente de melhorar o alinhamento dos assistentes de IA; o SteerLM treina os assistentes praticando conversas, tal como os robots aprendem. O sistema fornece feedback sobre as respostas do assistente através de atributos como a utilidade, o humor e a qualidade.

Por exemplo, um robô aprende danças a partir de vídeos marcados como bons ou maus, em vez de um humano que vê milhares de danças aleatórias e escolhe quais são boas ou más (que é a forma geral como os chatbots de IA aprendem). Através da prática repetida e do feedback, o assistente aprende a dar respostas personalizadas. Isto ajuda a tornar a IA mais útil em aplicações do mundo real.

O que têm em comum é a utilização de redes neuronais avançadas de formas novas e criativas, quer em robôs quer em chatbots A Nvidia está a ultrapassar os limites tanto no hardware como no software.

Para a Eureka, era importante combinar técnicas de simulação como Isaac Jim com as capacidades de reconhecimento de padrões dos modelos de linguagem. O Eureka “aprende enquanto aprende” e optimiza o seu próprio algoritmo de recompensa através de treinos repetidos. Também aceita a contribuição humana para melhorar as suas recompensas.

Esta abordagem de auto-aperfeiçoamento provou até agora ser muito versátil e pode treinar todos os tipos de robôs: pernas, rodas, voo, mãos hábeis, etc.

O Eureka e o SteerLM da Nvidia não só quebram barreiras, como ensinam aos robôs e à IA a arte da interação subtil e perspicaz. Com cada traço de caneta e conversa espirituosa, imaginam um futuro em que a inteligência artificial não só imita, como inova ao nosso lado.

Related Posts

Leave a Comment