Categories: NEWS

OpenAI rilascia un aggiornamento per ChatGPT: supporto alla generazione di immagini in chat

OpenAI ha recentemente presentato una nuova funzionalità che consente la generazione di immagini direttamente all’interno di ChatGPT, denominata ‘ChatGPT immagini’. Questa innovazione, resa possibile grazie al modello omnimodale GPT-4o, permette agli utenti di creare immagini in tempo reale mentre interagiscono in conversazioni testuali. La funzionalità è disponibile per gli abbonati di ChatGPT Plus, Pro e Team, sia per gli utenti paganti che per quelli gratuiti, e si prevede che sarà presto accessibile anche per le versioni Enterprise ed Edu.

Capacità del modello

Sul blog ufficiale di OpenAI, l’azienda ha messo in evidenza le straordinarie capacità di ChatGPT immagini, in grado di generare immagini fotorealistiche. Tra gli esempi pubblicati, spicca una rappresentazione di Karl Marx davanti a un centro commerciale negli Stati Uniti. A differenza di altri generatori di immagini basati su intelligenza artificiale, che talvolta faticano a mantenere coerenza nei colori e nelle forme, ChatGPT immagini riesce a associare correttamente attributi a un numero significativamente maggiore di oggetti.

Un aspetto innovativo riguarda la capacità del modello di gestire il testo all’interno delle immagini. Grazie a questa funzionalità, il sistema può trascrivere riferimenti testuali in modo preciso e senza errori di battitura, affrontando così una delle principali sfide nel campo della generazione di immagini tramite intelligenza artificiale. Gabriel Goh, responsabile della ricerca di OpenAI, ha dichiarato al sito The Verge che questo risultato è frutto di “molti mesi di piccoli miglioramenti”.

Approccio tecnico

Dal punto di vista tecnico, il sistema adotta un approccio ‘auto regressivo’, generando immagini in sequenza, in modo simile a come si scrive un testo. Questa metodologia si distingue nettamente dalla tecnica del modello di diffusione, utilizzata da strumenti come DALL-E, che producono l’immagine intera in un’unica operazione.

Nonostante l’elevata qualità delle immagini generate, OpenAI ha deciso di non applicare filigrane visive, optando invece per l’inclusione di metadati standard che attestano l’origine delle immagini. Questa scelta mira a garantire un utilizzo più flessibile delle immagini create, mantenendo comunque traccia della loro provenienza. La nuova funzionalità rappresenta un passo avanti significativo nel campo della generazione di contenuti visivi attraverso l’intelligenza artificiale, ampliando le possibilità creative per gli utenti di ChatGPT.

Luisa Bindi

Recent Posts

Riesci a risolvere il Test del Qi in 10 secondi? Il 97% delle persone fallisce miseramente

La stragrande maggioranza delle persone fallisce questo test: riesci a risolverlo in soli 10 secondi?…

3 ore ago

Offerta shock da Lidl: questi mobili ora sono a prezzi ridicoli, se aspetti troppo gli altri ne approfittano

Da Lidl arriva un'offerta davvero molto interessante, per ciò che concerne i mobili. Prezzi convenienti,…

5 ore ago

Elodie, svolta di carriera: diventa conduttrice, sarà al timone di un programma cult

La famosissima cantante Elodie debutterà come conduttrice in uno dei più amati programmi della tv:…

14 ore ago

Fino a 3mila euro di multa se non hai questo documento dell’auto: l’errore che ti costa un salasso

Chiunque sia alla guida di un veicolo conosce l'importanza di avere a bordo la patente…

16 ore ago

Quando arrivano i pagamenti Inps di aprile: il calendario

Le misure di sostegno erogate dall'INPS sono fondamentali per molte famiglie italiane, e ritardi nei…

17 ore ago

Lavare i piatti, con il metodo della nonna ti sbrighi in 10 minuti: l’ingrediente magico

Grazie al metodo della nonna e all'ingrediente giusto potremo lavare a tempo di record i…

20 ore ago