Home » OpenAI aggiorna ChatGPT: Il chatbot AI può ora “vedere, ascoltare e parlare”.

OpenAI aggiorna ChatGPT: Il chatbot AI può ora “vedere, ascoltare e parlare”.

by Tim

OpenAI ha lanciato gli attesissimi aggiornamenti che permetteranno al suo popolare chatbot ChatGPT di interagire con immagini e voci. Questo lancio rappresenta un passo importante verso la visione di OpenAI di un’intelligenza artificiale generale in grado di percepire ed elaborare informazioni da più modalità, non solo dal testo.

“Stiamo iniziando a introdurre nuove funzionalità vocali e di immagine in ChatGPT. Esse offrono un nuovo tipo di interfaccia più intuitiva, consentendo di avere una conversazione vocale o di mostrare a ChatGPT ciò di cui si sta parlando”, ha dichiarato OpenAI nel suo post sul blog ufficiale.

OpenAI ha dichiarato che la nuova ChatGPT-Plus includerà una chat vocale alimentata da un nuovo modello di text-to-speech in grado di imitare le voci umane e la possibilità di discutere di immagini grazie all’integrazione con i modelli di generazione di immagini dell’azienda. Le nuove funzionalità sembrano far parte della cosiddetta GPT Vision (o GPT-V, spesso confusa con una teorica GPT-5) e rappresentano componenti chiave della versione multimodale migliorata della GPT-4 che OpenAI ha annunciato all’inizio di quest’anno.

Questo aggiornamento arriva subito dopo che OpenAI ha presentato DALL-E 3, il suo generatore di testo-immagine più avanzato. Acclamato come “folle” dai primi tester per la sua qualità e accuratezza, DALL-E 3 è in grado di creare immagini ad alta fedeltà a partire da richieste di testo, comprendendo al contempo contesti e concetti complessi espressi in linguaggio naturale. Sarà integrato in ChatGPT Plus, un servizio in abbonamento che offre un ChatGPT basato su GPT-4.

L’integrazione di DALL-E 3 e della chat vocale conversazionale è il segno della spinta di OpenAI verso assistenti AI in grado di percepire il mondo come gli esseri umani – con più sensi. Secondo l’azienda: “La voce e le immagini offrono più modi per utilizzare ChatGPT nella vostra vita. Scattate una foto di un punto di riferimento mentre siete in viaggio e conversate in diretta su ciò che c’è di interessante. “

Microsoft alimenta la corsa all’intelligenza artificiale con l’integrazione di OpenAI

Anche il maggiore finanziatore di OpenAI, Microsoft, sta procedendo con l’integrazione delle avanzate capacità di IA generativa di OpenAI nei propri prodotti di consumo. In occasione del recente evento autunnale, Microsoft ha annunciato aggiornamenti dell’intelligenza artificiale per Windows 11, Office e la ricerca Bing, sfruttando modelli come DALL-E 3 (in programmi di modifica delle immagini come il rinnovato Paint di Microsoft) e Copilot, l’assistente di programmazione di OpenAI.

Ciò è in linea con l’investimento di oltre 10 miliardi di dollari di Microsoft in OpenAI, con l’obiettivo di guidare la corsa agli assistenti AI. Il debutto di Copilot in Windows 11 il 26 settembre promette di rendere disponibile l’aiuto dell’IA su tutte le piattaforme e i dispositivi Microsoft. Nel frattempo, Microsoft 365 Chat applica l’abilità di OpenAI nel linguaggio naturale per automatizzare attività lavorative complesse.

Come riportato in precedenza da TCN, Microsoft ha dichiarato che “Microsoft 365 Chat analizza l’intero universo di dati del lavoro, tra cui e-mail, riunioni, chat, documenti e altro ancora, oltre al web. “

Passi prudenti verso un’intelligenza artificiale responsabile

Tuttavia, OpenAI è ben consapevole dei potenziali rischi legati ai sistemi di IA multimodali più potenti che coinvolgono la visione e la generazione vocale. L’impersonificazione, i pregiudizi e la dipendenza dall’interpretazione visiva sono i principali problemi.

“L’obiettivo di OpenAI è costruire un’intelligenza artificiale sicura e vantaggiosa”, ha scritto l’azienda nel suo annuncio. “Crediamo nel rendere disponibili i nostri strumenti in modo graduale, il che ci permette di apportare miglioramenti e affinare le mitigazioni dei rischi nel corso del tempo, preparando al contempo tutti a sistemi più potenti in futuro. “

Inoltre, come riportato in precedenza da TCN, OpenAI sta mettendo insieme un red team per lavorare su come prevenire le conseguenze dannose dovute all’uso improprio dei suoi prodotti di intelligenza artificiale. L’amministratore delegato Sam Altman ha anche fatto pressioni in tutto il mondo per ottenere una legislazione favorevole.

OpenAI ha dichiarato che gli utenti Plus ed Enterprise avranno accesso a queste nuove funzionalità nelle prossime due settimane, con l’intenzione di estendere la disponibilità agli sviluppatori in seguito. E con l’annuncio da parte di Google del suo rivoluzionario LLM multimodale, Gemini, la corsa per dominare l’industria dell’IA è appena iniziata

Related Posts

Leave a Comment