OpenAI ha introdotto questa settimana ChatGPT Images 2.0, un modello aggiornato per la generazione di immagini. Secondo l’azienda, l’obiettivo è dare inizio a una nuova fase nella creazione di contenuti visivi, con prestazioni più solide su attività visivamente complesse.
Il modello è progettato per seguire istruzioni dettagliate, posizionare e collegare gli oggetti in modo accurato, preservare i dettagli e renderizzare layout densi. OpenAI lo descrive inoltre come il suo primo modello di immagini con capacità di “thinking”, con un miglioramento di composizione e “visual taste” per ottenere risultati che, secondo l’azienda, risultano meno riconoscibili come generati dall’IA.
Tra le nuove funzioni, Images 2.0 può anche cercare sul web per ottenere informazioni in tempo reale, generare fino a otto immagini a partire da un singolo prompt e “ricontrollare” l’output. La creazione delle grafiche supporta diversi aspect ratio e risoluzioni fino a 2K.
OpenAI segnala anche un miglioramento della comprensione multilingue e una resa più efficace di testi non latini, citando giapponese, coreano, cinese, hindi e bengalese.
ChatGPT Images 2.0 è disponibile ora per tutti gli utenti di ChatGPT, Codex e API.

