ChatGPT+Vision+arriva+in+Italia%3A+cos%26%238217%3B%C3%A8+e+come+funziona
cryptohackit
/chatgpt-vision-arriva-italia-cosa-e-come-funziona/amp/
Intelligenza Artificiale

ChatGPT Vision arriva in Italia: cos’è e come funziona

Anche l’Italia ha ufficialmente accolto ChatGPT Vision, la nuova funzione di ChatGPT che consente agli utenti di sfruttare un nuovo grado dell’intelligenza artificiale generativa messa a punto da OpenAI e in grado ora di vedere cose e persone.

Per il momento questa funzione innovativa è stata messa a disposizione esclusivamente degli abbonati al servizio ChatGPT Plus (il servizio premium di ChatGPT al costo mensile di 24 euro, ndr), ma ciò non significa che in futuro non possa essere estesa anche ad altri utenti.

Proviamo a capire quali sono le novità introdotte da ChatGPT Vision e se tale funzione possa davvero essere considerata rivoluzionaria oppure no.

Che cos’è ChatGPT Vision?

Come anticipato a inizio approfondimento, ChatGPT Vision è la nuova funzione di OpenAI che permette di esaminare immagini di oggetti e persone e riconoscerle, formulando anche delle risposte creative in maniera naturale.

Tutto ciò è reso possibile dall’intelligenza artificiale generativa, strumento che differenzia le novità introdotte da ChatGPT Vision da quelle presenti in altre piattaforme già esistenti.

Immagine | Unsplash @RolfVanRoot – Cryptohack.it

Per esempio, Google Lens consente già da tempo di estrapolare delle informazioni dettagliate riguardanti gli elementi presenti in una foto presa in analisi. Esso è in grado di ricercare sul web gli oggetti mostrati nell’immagine e di fornire utili link di collegamento alla foto proposta.

Funzioni che anche ChatGPT Vision è capace di svolgere e alle quali, nel suo caso, affianca anche la forza dell’intelligenza artificiale generativa.

Gli utenti possono, quindi, selezionare un’immagine dal proprio computer e aggiungere a essa una domanda o una richiesta specifica, la quale verrà soddisfatta dall’intelligenza artificiale.

Viene, dunque, data la possibilità di instaurare un vero e proprio dialogo tra esseri umani e intelligenza artificiale, la quale è in grado di formulare delle risposte che sembrano pensate da una mente animata, reale.

ChatGPT Vision consente usi pressoché illimitati, sebbene OpenAI abbia già precisato che non sia possibile richiedere all’intelligenza artificiale delle informazioni riguardanti le persone raffigurate in una foto.

Ciò serve anche a tutelare la privacy delle persone, con ChatGPT Vision che non si pone, infatti, l’obiettivo di diventare un software di riconoscimento facciale.

È giusto, però, sottolineare come esistano attualmente alcuni “bug” legati a quest’ultima funzione, dal momento che, in alcuni casi, è stata riscontrata la possibilità di aggirare le regole di OpenAI e ottenere delle risposte dall’intelligenza artificiale anche partendo dall’immagine di una singola persona.

Un problema, anche potenzialmente grave, per la sicurezza e che OpenAI dovrà risolvere il prima possibile, così da non correre il rischio che la propria tecnologia venga sfruttata per scopi poco etici e anche criminali.

Ciò che ChatGPT Vision riesce a fare, infatti, è leggere e capire le immagini che vengono proposte all’intelligenza artificiale.

È così che può raccontare la storia degli oggetti presenti in una foto, spiegare quale sia il loro significato e quale la loro funzione nella società.

Stiamo praticamente parlando di uno scanner di immagini, di un cervellone capace di soddisfare ogni nostra curiosità (o quasi) legata a una determinata foto.

ChatGPT Vision è una sorta di enciclopedia del Mondo, uno strumento estremamente potente per poter analizzare ciò che si trova davanti ai nostri occhi nel presente o che si lega al passato e, perché no, anche al futuro.

Tale sistema, però, non è privo di errori.

Diversi utenti hanno riscontrato, infatti, come l’intelligenza artificiale a volta riporti delle risposte errate nella descrizione di alcuni oggetti.

Capita, infatti, che l’AI faccia confusione e descriva un determinato oggetto piuttosto che un altro, non soddisfacendo così la curiosità di chi ha posto la domanda, bensì confondendolo ancora di più.

Si tratta pur sempre di una tecnologia ancora in fase di sviluppo e che, per tanto, deve essere trattata con attenzione.

Il consiglio è sempre quello di verificare le informazioni riportate dall’intelligenza artificiale, così da capire se essa ci stia dicendo il vero o il falso.

La forza dell’AI

Oltre all’analisi semplice e pura delle immagini, ChatGPT Vision è in grado di svolgere anche funzioni più avanzate.

Per esempio, essa può proporre una ricetta in base agli ingredienti presenti in una foto o un piano di allenamento in palestra basandosi sugli attrezzi raffigurati in un’immagine.

C’è chi ha chiesto all’intelligenza artificiale per quale arredamento è meglio optare in una determinata stanza della casa e chi ha provato a ottenere le parole nascoste in un documento non classificato della National Security Agency americana (la NSA, ndr) e nel quale si parla dell’avvistamento di un UFO.

Esempi creativi che dimostrano le grandi potenzialità di cui ChatGPT Vision dispone, sebbene tale tecnologia non sia priva di limiti, errori potenziali e problematiche.

Come già scritto in precedenza, sarebbe bene verificare sempre tutte le risposte formulate dall’AI, visto che talvolta esse si basano meramente sul calcolo statistico delle probabilità e non su una certezza scientifica o su elementi dimostrabili.

ChatGPT Vision è in grado anche di leggere storie e di crearne a sua volta, partendo dagli elementi proposti in un’immagine e sviluppandone di nuovi a corollario.

Sa fornire dettagli su come riparare un oggetto rotto, quante calorie sono presenti pressappoco in un piatto o se il livello di cottura di un cibo sembra essere ottimale o meno.

Il tutto basandosi sempre sulle immagini che vengono fornite alla piattaforma e che l’intelligenza artificiale generativa riesce poi a studiare ed elaborare.

ChatGPT Vision crea quindi dei testi a descrizione delle foto, ma può creare anche delle immagini, a volte decisamente più utili per descrivere un prodotto. Può anche parlare.

A risultate particolarmente efficace, in questo caso, è GPT-4V, il modello più avanzato di ChatGPT che riesce a esprimersi in maniera molto più creativa rispetto a ChatGPT-3.5, ovvero della versione gratuita e disponibile per tutti.

Il punto di forza di ChatGPT Vision è proprio la multi-modalità di GPT-4V, sfruttata sia nella sua parte testuale che in quella visiva.

Ad oggi, ChatGPT Vision è disponibile esclusivamente per la versione desktop di ChatGPT, ovvero per quella accessibile via browser su un computer.

Al momento, sull’app ufficiale di ChatGPT non pare esserci traccia di alcun aggiornamento, sia per quanto riguarda il sistema Android che il sistema iOS.

Marco Garghentino

Brianzolo dal 1996, ho sempre pensato che la comunicazione sia la principale arte che l’uomo ha sviluppato nei secoli. Amo lo sport, conoscere il Mondo ed essere informato. Ogni vita ha una storia e spesso vale la pena raccontarla.

Recent Posts

PlayStation 5 Pro rischia di essere un flop? Le reazioni al reveal sono state negative

Pur proponendo alcuni passi avanti dal punto di vista tecnico, la console sembra essere destinata…

1 settimana ago

Google Maps, ecco perché per i ladri è un alleato prezioso

Alcuni proprietari di immobili, che vivono in California, stanno sfocando le proprie abitazioni su Google…

1 settimana ago

WhatsApp, cambiare alcune impostazioni aiuta a difendersi dalle truffe e dallo spam

Negli ultimi anni sono aumentate le truffe online e anche quelle tramite messaggistica: gli imbroglioni…

2 settimane ago

Concord chiude dopo appena due settimane. Breve storia del più grosso flop di Sony nell’era PS5

Dopo il lancio disastroso, il numero di utenti attivi è calato sempre di più e…

2 settimane ago

IA e aziende, l’Italia è tra i Paesi early adopter

Il nostro Paese tra i primi a utilizzare l'intelligenza artificiale nel campo dell'imprenditoria. Ma le…

2 settimane ago

Apple, arriva un nuovo assistente virtuale IA, cosa sappiamo

Definendo un nuovo standard per la privacy nell’AI, Apple Intelligence capisce il contesto personale per…

3 settimane ago