Categories: NEWS

OpenAI rilascia un aggiornamento per ChatGPT: supporto alla generazione di immagini in chat

OpenAI ha recentemente presentato una nuova funzionalità che consente la generazione di immagini direttamente all’interno di ChatGPT, denominata ‘ChatGPT immagini’. Questa innovazione, resa possibile grazie al modello omnimodale GPT-4o, permette agli utenti di creare immagini in tempo reale mentre interagiscono in conversazioni testuali. La funzionalità è disponibile per gli abbonati di ChatGPT Plus, Pro e Team, sia per gli utenti paganti che per quelli gratuiti, e si prevede che sarà presto accessibile anche per le versioni Enterprise ed Edu.

Capacità del modello

Sul blog ufficiale di OpenAI, l’azienda ha messo in evidenza le straordinarie capacità di ChatGPT immagini, in grado di generare immagini fotorealistiche. Tra gli esempi pubblicati, spicca una rappresentazione di Karl Marx davanti a un centro commerciale negli Stati Uniti. A differenza di altri generatori di immagini basati su intelligenza artificiale, che talvolta faticano a mantenere coerenza nei colori e nelle forme, ChatGPT immagini riesce a associare correttamente attributi a un numero significativamente maggiore di oggetti.

Un aspetto innovativo riguarda la capacità del modello di gestire il testo all’interno delle immagini. Grazie a questa funzionalità, il sistema può trascrivere riferimenti testuali in modo preciso e senza errori di battitura, affrontando così una delle principali sfide nel campo della generazione di immagini tramite intelligenza artificiale. Gabriel Goh, responsabile della ricerca di OpenAI, ha dichiarato al sito The Verge che questo risultato è frutto di “molti mesi di piccoli miglioramenti”.

Approccio tecnico

Dal punto di vista tecnico, il sistema adotta un approccio ‘auto regressivo’, generando immagini in sequenza, in modo simile a come si scrive un testo. Questa metodologia si distingue nettamente dalla tecnica del modello di diffusione, utilizzata da strumenti come DALL-E, che producono l’immagine intera in un’unica operazione.

Nonostante l’elevata qualità delle immagini generate, OpenAI ha deciso di non applicare filigrane visive, optando invece per l’inclusione di metadati standard che attestano l’origine delle immagini. Questa scelta mira a garantire un utilizzo più flessibile delle immagini create, mantenendo comunque traccia della loro provenienza. La nuova funzionalità rappresenta un passo avanti significativo nel campo della generazione di contenuti visivi attraverso l’intelligenza artificiale, ampliando le possibilità creative per gli utenti di ChatGPT.

Luisa Bindi

Next DeepSeek presenta il nuovo modello di intelligenza artificiale 'V3': gratuito e rapido »

Previous « Alan Cumming riceve il premio Stella della Mole durante il Lovers Festival

Published by

Luisa Bindi

4 settimane ago

Stefano De Martino “papà bis”: le foto da brividi emozionano tutti

Stefano De Martino e le foto da brividi che riguardano una fascia privata della sua…

5 ore ago

NEWS

ISEE, non tutti sanno che puoi escludere il libretto postale: il trucco legale che fa la differenza

L’Indicatore della Situazione Economica Equivalente (ISEE) rappresenta uno strumento cruciale per l'accesso a prestazioni sociali…

11 ore ago

CINEMA E TV

Masterchef, paura per l’infarto del concorrente: cast e giudici sbiancati

Il mondo di Masterchef, il celebre talent show culinario, è spesso caratterizzato da sfide ad…

12 ore ago

NEWS

LIDL, ma hanno sbagliato il prezzo? L’elettrodomestico che sogni da sempre, ora costa pochissimo

Lidl continua a sorprendere con offerte che uniscono qualità e convenienza, e la sua ultima…

16 ore ago

NEWS

Alessandro Borghese super felice: l’annuncio improvviso prima di Pasqua

La Pasqua 2025 si avvicina e, come da tradizione, il mondo della gastronomia si prepara…

1 giorno ago

NEWS

Il bis a tavola è pericoloso? Cosa devi sapere prima di riscaldare il cibo

Quando si tratta di sicurezza alimentare, il tema del "bis a tavola" è di grande…