Home » A OpenAI actualiza o ChatGPT: O chatbot de IA pode agora “ver, ouvir e falar”

A OpenAI actualiza o ChatGPT: O chatbot de IA pode agora “ver, ouvir e falar”

by Patricia

A

OpenAI lançou actualizações muito aguardadas que permitirão ao seu popular chatbot ChatGPT interagir com imagens e vozes. Este lançamento representa um passo importante para a visão da OpenAI de uma inteligência artificial geral que pode perceber e processar informações de vários modos, não apenas texto.

“Estamos a começar a implementar novas capacidades de voz e imagem no ChatGPT. Oferecem um tipo de interface novo e mais intuitivo, permitindo-lhe ter uma conversa por voz ou mostrar ao ChatGPT aquilo de que está a falar”, afirmou a OpenAI no seu blogue oficial.

A OpenAI disse que o novo ChatGPT-Plus incluirá conversação por voz com um novo modelo de texto para voz capaz de imitar vozes humanas e a capacidade de discutir imagens graças à integração com os modelos de geração de imagens da empresa. As novas funcionalidades parecem fazer parte do que é conhecido como GPT Vision (ou GPT-V, que é muitas vezes confundido com um GPT-5 teórico) e representam componentes-chave da versão multimodal melhorada do GPT-4 que a OpenAI apresentou no início deste ano

Esta atualização surge logo após a OpenAI ter revelado o DALL-E 3, o seu gerador de texto-imagem mais avançado até à data. Aclamado como “insano” pelos primeiros testadores devido à sua qualidade e precisão, o DALL-E 3 pode criar imagens de alta fidelidade a partir de mensagens de texto, ao mesmo tempo que compreende contextos e conceitos complexos expressos em linguagem natural. Será incorporado no ChatGPT Plus, um serviço baseado em subscrição que oferece um ChatGPT alimentado por GPT-4.

A integração do DALL-E 3 e do chat de voz conversacional significa o impulso da OpenAI em direção aos assistentes de IA que podem perceber o mundo mais como os humanos – com múltiplos sentidos. De acordo com a empresa: “A voz e a imagem oferecem-lhe mais formas de utilizar o ChatGPT na sua vida. Tire uma fotografia de um ponto de referência enquanto viaja e tenha uma conversa em direto sobre o que é interessante nesse ponto. “

Microsoft alimenta a corrida da IA com a integração do OpenAI

Como já tinha sido noticiado pela TCN, a Microsoft afirmou que o “Microsoft 365 Chat percorre todo o seu universo de dados no trabalho, incluindo e-mails, reuniões, chats, documentos e muito mais, para além da Web”.

Passos cautelosos em direção a uma IA responsável

No entanto, a OpenAI está bem ciente dos potenciais riscos com sistemas de IA multimodais mais poderosos que envolvem visão e geração de voz. A personificação, a parcialidade e a dependência da interpretação visual são preocupações fundamentais.

“O objetivo da OpenAI é construir uma IA que seja segura e benéfica”, escreveu a empresa no seu anúncio. “Acreditamos em disponibilizar nossas ferramentas gradualmente, o que nos permite fazer melhorias e refinar as mitigações de risco ao longo do tempo, ao mesmo tempo em que preparamos todos para sistemas mais poderosos no futuro.

Além disso, como TCN relatou anteriormente, OpenAI está montando uma equipe vermelha para trabalhar em maneiras de evitar consequências prejudiciais devido ao uso indevido de seus produtos de IA. O CEO Sam Altman também tem feito lobby em todo o mundo por uma legislação favorável.

A OpenAI disse que os utilizadores Plus e Enterprise terão acesso a estas novas funcionalidades durante as próximas duas semanas, com planos para expandir a disponibilidade para os programadores posteriormente. E com a Google a anunciar também o seu próprio e revolucionário LLM multimodal, Gemini, a corrida para dominar a indústria da IA está apenas a começar

Related Posts

Leave a Comment