Stato dell'arte

Al momento i chatbot di IA allo stato dell'arte sono ChatGPT di OpenAI, Gemini di Google, Copilot di Microsoft, e Claude di Anthropic. Tutti questi modelli sono multimodali, ovvero accettano in input e forniscono in output sia testo che immagini (e in futuro probabilmente anche suono e video).

ChatGPT

ChatGPT è un chatbot creato da OpenAI, società fondata nel 2015 da Elon Musk e Sam Altman come no-profit. Successivamente ha ricevuto un consistente investimento di 10 miliardi di Dollari da Microsoft ed è diventata for-profit.

Attualmente ChatGPT offre 4 versioni:

  • Free: Accesso limitato al modello GPT-3.5, 8K context window, gratuito

  • Plus: Accesso prioritario a GPT-4, il modello più avanzato al momento di OpenAI, possibilità di usare e creare GPT, 32K context window, prezzo 24.40$ (22.96E) per utente al mese (fatturazione mensile, nessun periodo gratuito)

  • Team: Tutto ciò che offre la versione Plus e in più la possibilità di creare e gestire un team di lavoro (ad esempio una classe di studenti) dove condividere le ricerche e le GPT, i dati usati nello spazio non vengono inclusi nel training del modello, prezzo 30.50$ (28.70E) per utente al mese con fatturazione annuale o 36.60$ (34.44E) con fatturazione mensile

  • Enterprise: Pensato per le aziende, accesso più veloce al modello GPT-4 e migliori tempi di risposta, 128K context window, supporto prioritario, dati esclusi dal training del modello, prezzo da contrattare con l'ufficio vendite.

Il principale vantaggio di ChatGPT è la possibilità di usare e creare GPT, ovvero una sorta di app di IA specializzate in particolari compiti, tipo la computazione, la matematica, l'analisi dei dati, la ricerca di bibliografia scientifica, la generazione e correzione di codice, la scrittura creativa, la generazione di immagini.

Uno svantaggio di ChatGPT è che non si integra con le applicazioni del sistema operativo che si sta usando, cosa che invece fanno i concorrenti Gemini (Google) e Copilot (Microsoft). Inoltre, non ha accesso diretto al Web. ChatGPT si può usare da Web o da app mobile.

Gemini

Gemini è un chatbot sviluppato da DeepMind, società di IA di proprietà di Google.

Gemini offre una versione base gratuita e una versione Advanced al prezzo di 21.99E al mese per utente (fatturazione mensile, primi due mesi gratuiti). La versione avanzata ha le seguenti caratteristiche:

  • accesso a Gemini Ultra, il modello IA più potente sviluppato da Google

  • integrazione nell'ecosistema di Google, in particolare utilizzo dell'IA in Gmail e Docs (scrittura, solo lingua Inglese al momento), Slides (creazione di immagini) e Meet (qualità video)

  • videoconferenze Meet senza limiti e con registrazione

  • 2TB di spazio cloud

Il principale vantaggio di Gemini è l'integrazione con alcune delle applicazioni di Google. Inoltre ha accesso al Web tramite il motore di ricerca Google Search e offre la possibilità di validare le risposte fornite dal chatbot attraverso la ricerca sul Web. Al momento in Italia Gemini è accessibile solo da Web e non da app mobile. La generazione di immagini con Gemini (anche con la versione Advanced) è temporaneamente sospesa.

Copilot

Copilot è un chatbot sviluppato da Microsoft. Copilot si basa sul modello linguistico Microsoft Prometheus, costruito su GPT-4 di OpenAI.

Copilot ha una versione base gratuita e una versione Pro al prezzo di 22E al mese per utente (fatturazione mensile, primo mese gratuito). La versione avanzata offre le seguenti caratteristiche:

  • accesso prioritario a GPT-4 anche durante gli orari di punta

  • integrazione nell'ecosistema Microsoft con possibilità di integrare l'IA in Word, Excel, PowerPoint e Outlook (su Web e anche nella versione desktop in caso di un abbonamento separato a Microsoft 365 Personal o Family ma non Microsoft 365 Business)

  • creare Copilot GPT personalizzati

Dunque il principale vantaggio di Copilot è l'integrazione con le applicazioni Microsoft. Inoltre, come per Gemini, Copilot ha accesso al Web tramite il motore di ricerca Microsoft Bing (con possibilità di validare le risposte). Copilot si può usare su Web o come app mobile.

Claude

Un quarto chatbot è Claude sviluppato da Anthropic, purtroppo al momento non disponibile in Europa.

Anthropic è stata fondata nel 2021 da ex membri di OpenAI, Daniela Amodei e Dario Amodei. Nel settembre 2023, Amazon ha annunciato un investimento fino a 4 miliardi di dollari, seguito da un impegno di 2 miliardi di dollari da parte di Google nel mese successivo.

Claude è stata la versione iniziale del modello linguistico di Anthropic, rilasciata nel marzo 2023. Claude 2 è stata la successiva iterazione di Claude, rilasciata nel luglio 2023 e disponibile al pubblico. Claude 3 è stato rilasciato nel marzo 2024. La famiglia Claude 3 comprende tre modelli all'avanguardia in ordine crescente di capacità: Haiku, Sonnet e Opus. Claude 3 è sembrato in grado di eseguire ragionamenti metacognitivi, compresa la capacità di rendersi conto di essere artificialmente testato durante una valutazione di tipo ago in un pagliaio (needle in a haystack).

Claude utilizza un modello di addestramento noto come Constitutional AI (CAI). L'idea è che la supervisione umana derivi interamente da un insieme di principi che dovrebbero governare il comportamento dell'IA, insieme a un piccolo numero di esempi. L'insieme di questi principi costituisce la costituzione del modello linguistico. La costituzione di Claude comprende 75 punti, tra cui sezioni della Dichiarazione universale dei diritti umani delle Nazioni Unite. Questo approccio consente di formare assistenti IA che siano al tempo stesso utili e innocui e che siano in grado di spiegare le loro obiezioni alle richieste dannose, migliorando la trasparenza e riducendo la dipendenza dalla supervisione umana.

Constitutional AI

L'IA costituzionale (CAI) si riferisce a un metodo in cui il sistema di IA è guidato da un insieme di principi (costituzione) a cui deve attenersi durante la generazione delle risposte. Questa costituzione è progettata per incapsulare linee guida etiche, norme di sicurezza e comportamenti allineati ai valori umani. L'idea generale può essere riassunta come segue:

  1. Contesto: Il modello di intelligenza artificiale è dotato di un insieme di principi fondamentali che agisce come una costituzione a cui l'IA fa riferimento quando prende decisioni o genera risposte.

  2. Addestramento: Durante l'addestramento, al modello viene insegnato a fare riferimento e a interpretare questa costituzione, allineando i suoi risultati alle linee guida specificate al suo interno. Ciò avviene un due fasi: una fase di apprendimento supervisionato con feedback umano seguita da una fase di apprendimento per rinforzo per perfezionare l'allineamento del modello con i principi costituzionali.

  3. Esecuzione: Quando l'intelligenza artificiale è in uso, utilizza i principi della sua costituzione per guidare le sue risposte. Se il modello incontra situazioni o dilemmi ambigui, si atterrà alle linee guida stabilite nella costituzione per orientarsi.

  4. Adattabilità: La costituzione non è un documento statico. Può essere aggiornata o ampliata in base ai feedback, ai cambiamenti della società o all'evoluzione della comprensione del comportamento etico dell'IA.

  5. Trasparenza: Basando le risposte su un insieme chiaro di principi, la CAI mira ad aumentare la trasparenza delle decisioni prese, rendendo più facile per gli utenti comprendere e prevedere il comportamento dell'IA

Last updated