sabato 21 gennaio 2023

ChatGPT

ChatGPT (Chat Generative Pre-trained Transformer) è un prototipo di chatbot basato su intelligenza artificiale e machine learning sviluppato da OpenAI specializzato nella conversazione con un utente umano[1].

ChatGPT è un modello linguistico di grandi dimensioni messo a punto con tecniche di apprendimento automatico (di tipo non supervisionato), e ottimizzato con tecniche di apprendimento supervisionato e per rinforzo[2][3], che è stato sviluppato per essere utilizzato come base per la creazione di altri modelli di machine learning. ChatGPT è stato addestrato a partire dai modelli Instruct GPT, (o GPT-3.5[4]) di OpenAI, che sono l'evoluzione dei modelli di GPT-3. Gli Instruct GPT (come code-davinci-002, text-davinci-002, text-davinci-003[5]) sono modelli in cui il pre-addestramento è stato ottimizzato manualmente da addestratori umani. Nello specifico ChatGPT è stato sviluppato da un GPT-3.5 utilizzando l'apprendimento supervisionato e l'apprendimento per rinforzo come tecniche di ottimizzazione del modello[6].

ChatGPT è stato lanciato il 3 novembre 2022[7] e ha attirato l'attenzione per le sue risposte dettagliate e articolate, sebbene la sua accuratezza sia stata criticata. Sia l'apprendimento supervisionato che l'apprendimento per rinforzo hanno utilizzato istruttori umani per migliorare le prestazioni del modello. Nel primo caso il modello è stato alimentato con conversazioni nelle quali gli istruttori interpretavano entrambe le parti: l'utente e l'assistente basato su intelligenza artificiale. Nella fase di rinforzo, gli istruttori umani hanno prima valutato le risposte che il modello aveva creato nella conversazione precedente. Queste valutazioni sono state utilizzate per creare "modelli di ricompensa" sui quali il modello è stato ulteriormente perfezionato, utilizzando diverse iterazioni di Proximal Policy Optimization (PPO)[8][9]. Gli algoritmi di Proximal Policy Optimization presentano un vantaggio su algoritmi di Trust Region Policy Optimization annullando molte delle operazioni computazionalmente costose con prestazioni migliori[10]. I modelli sono stati addestrati in collaborazione con Microsoft sulla loro infrastruttura cloud Azure.

https://it.wikipedia.org/wiki/ChatGPT


Come usare ChatGPT

Dopo aver inserito le proprie credenziali verrete reindirizzati alla dashboard di ChatGPT.

Se già utilizzate GPT-3 non avrete problemi. Una volta raggiunta la pagina troverete una dashboard molto più semplificata di quello a cui siete abituati.

Ma se siete novizi non preoccupatevi comunque. L’utilizzo di ChatGPT3 è molto semplice e intuitivo. Una volta raggiunta la dashboard troverete infatti solamente una linea di comando e nessun parametro da settare.

dashboard_chatGPT

Come vedete, nella stessa homepage di ChatGPT ci sono alcuni suggerimenti per iniziare la vostra interazione. Sarà sufficiente inserire un qualsiasi prompt nella riga di comando e premere INVIO.

Potete sbizzarirvi nella creazione delle vostre prompt, potete per esempio:

  • chiedere di scrivere una ricetta dati alcuni bizzarri ingredienti
  • scrivere un codice e o un pezzo di programma (GPT-3 è particolarmente bravo con javascript e python, ma non se la cava per nulla male con C, PHP o altri linguaggi)
  • scrivere un articolo ottimizzato SEO
  • aiutarvi nel costruire la vostra web app

ChatGPT risponderà in modo automatico, utilizzando le informazioni a sua disposizione per fornire risposte coerenti e realistiche e soprattutto originali. Senza bisogno di settare parametri del modello.

Come funziona ChatGPT

ChatGPT fa parte dei cosidetti InstructGPT che sono una evoluzione dei precedenti modelli basati unicamente sull’apprendimento non supervisionato.

I modelli Instruct infatti derivano dall’orginale GPT-3 ma sono ottimizzati attraverso il rinforzo umano. Nello specifico tramite una tecnica che si chiama Apprendimento tramite Rinforzo Umano (Reinforcement Learning from Human Feedback o RLHF).

La differenza di ChatGPT rispetto ad altri modelli Instruct (che vengono anche chiamati modelli GPT-3.5, come ad esempio text-davinci-003) è nel modo attraverso cui è stato allenato il modello.

Nel fine-tuning di ChatGPT, infatti, è stato chiesto ai supervisori umani di fornire sia le domande che le risposte desiderate. Queste sono state utilizzate come dataset per ottimizzare il modello ChatGPT.

ChatGPT_Diagram

ChatGPT è quindi un modello fratello degli InstructGPT, che è addestrato a seguire un’istruzione in un prompt e a fornire una risposta dettagliata.

Miglioramenti di ChatGPT rispetto ad altri modelli

ChatGPT risulta essere significativamente migliore di predecessori in quanto fornisce:

  • risposte più lungheChatGPT è significativamente più verboso sia di text-davinci-002 che anche di text-davinci-003
  • risposte più pertinentiChatGPT è significativamente più bravo di text-davinci-002 nel capire le richieste che gli vengono fatte.
  • risposte più sicureChatGPT è stato ottimizzato per ridurre le “allucinazioni” ossia la creazione di contenuti inventati

Inoltre è significativamente migliorata la produzione di codice, che non solo è possibile copiarlo direttamente con un click, ma viene anche spiegato, commentato, e, se espressamente richiesto dall’utente, anche debuggato e semplificato.

Il tutto senza dover impostare nulla: modello, temperatura, top_p, max_tokens etc. Tutto è nascosto e gira in modo automatico.

ChatGPT vs InstructGPT

Come potete vedere, qui viene confrontata la risposta di un InstructGPT, rispetto ad un ChatGPT. Come si può vedere dall’output, mentre il modello Instruct cede ad una “allucinazione” e inventa la risposta, ChatGPT è maggiormente coerente. La risposta è più verbosa ma corretta

 instruct GPT vs Chat GPT

 

ChatGPT è per ora il modello più evoluto di GPT-3

ChatGPT è, ad oggi, il modello più evoluto di GPT-3, adatto a chiunque voglia familiarizzare con questo modello in Intelligenza Artificiale e senza la necessità di settare i parametri o dover mettere mano al codice.

E’ stato realizzato allo scopo di raggiungere il grande pubblico e rendere quindi questa tecnologia alla portata di tutti. Non è un caso che a dicembre 2022 ci sia stato il boom di Chat GPT, con milioni di accessi giornalieri e costanti problemi di utilizzo del modello a causa dell’eccessivo traffico in entrata sui server di OpenAI.

ChatGPT rappresenta quindi un ulteriore passo in avanti di GPT-3 in quanto, il suo utilizzo su larga scala, sarà probabilmente il passo decisivo che ci porterà all’uscita di GPT-4.

Vantaggi di ChatGPT

Uno dei principali vantaggi di ChatGPT è la sua capacità di “imparare” dalla conversazione che ha con gli utenti. In questo modo, il sistema è in grado di adattarsi ai diversi stili di interazione e di offrire risposte sempre più pertinenti e personalizzate.

Inoltre è possibile tenere traccia della storia delle interazioni (trovate le vostre conversazioni nella sidebar di sinistra)

sidebar chat gpt

É un ottimo modo per provare e testare nuove prompt, familiarizzare con GPT-3 e aiutare attraverso la propria interazione all’ottimizzazione del modello.

Inoltre, aspetto non di poco conto. E’ assolutamente gratuito. Ha dei limiti di token e  non è possibile personalizzare i vari parametri del modello. Ma è in assoluto un ottimo strumento per familiarizzare con questa nuova intelligenza artificiale.

Il formato di dialogo consente infine a ChatGPT di rispondere a domande successive, ammettere i propri errori, contestare premesse errate e rifiutare richieste inappropriate.

Applicazioni che usano GPT

Stanno continuando ad uscire applicazioni che sfruttano la potenza di GPT-3 e dei suoi modelli per svolgere diverse funzioni specifiche. Noi abbiamo revisionato una di queste, si chiama GPT-Prompter.

GPT-Prompter è un’estensione di Chrome completamente gratuita che consente all’utente, direttamente mentre naviga, di utilizzare GPT senza dover passare dal sito di OpenAI.

Per maggiori informazioni su GPT-Prompter puoi leggere la nostra recensione.

Aggiornamenti di Chat GPT

15 dicembre 2022

Gli aggiornamenti del 15 dicembre per ChatGPT comprendono miglioramenti nella performance generale del modello, con una minore probabilità di rifiutare di rispondere alle domande.

Inoltre, gli utenti potranno presto visualizzare le conversazioni passate con ChatGPT, rinominare le conversazioni salvate e eliminare quelle non desiderate. È previsto anche un limite giornaliero per garantire un’esperienza di alta qualità per tutti gli utenti di ChatGPT, con la possibilità di estendere l’accesso fornendo feedback al modello.

9 gennaio 2023

Gli aggiornamenti del 9 gennaio per ChatGPT comprendono ulteriori miglioramenti al modello, con una maggiore efficacia su una vasta gamma di argomenti e una maggiore accuratezza dei fatti. Inoltre, è stato aggiunto il controllo per fermare la generazione della risposta di ChatGPT, in base alle richieste degli utenti.

17 gennaio 2023

Come quanto dichiarato sul proprio account di Twitter, saranno presto disponibile le API per poter utilizzare ChatGPT allo stesso modo con cui vengono utilizzare gli altri modelli di GPT-3.

chat GPT UPDATE

Limiti di ChatGPT

Come ogni modello di Intelligenza Artificiale, anche ChatGPT ha i suoi limiti.

Il primo aspetto riguarda il setting delle variabili del modello, per quanto un aspetto più tecnico e meno user friendly, la possibilità di misurare il livello di creatività attraverso la temperatura o il top_p ci è parsa una semplificazione eccessiva. Inoltre, da quello che abbiamo notato:

  • Il modello a volte produce risposte errate o senza senso, che possono essere difficili da correggere. Ciò può essere dovuto alla mancanza di una “fonte di verità” durante l’addestramento tramite rinforzo.
  • Il modello può essere sensibile a piccole modifiche nella frase di input o a ripetuti prompt, portando a risposte inconsistenti.
  • Il modello è spesso verboso e può ripetere troppo spesso alcune frasi o concetti, il che può essere causato da bias nei dati di addestramento o da problemi di sovraottimizzazione.
  • Il modello, pur essendo addestrato alla conversazione, non chiede domande di chiarimento quando la richiesta dell’utente è ambigua, ma cerca invece di indovinare ciò che l’utente intende.

Inoltre sebbene OpenAI abbia fatto sforzi per far rifiutare al modello richieste inappropriate, il modello può ancora rispondere a istruzioni dannose o mostrare comportamenti bias. L’API di moderazione viene utilizzata per segnalare o bloccare determinati tipi di contenuti non sicuri, ma può dare falsi positivi o falsi negativi.

Infine, l’alto numero di utenti sta facendo tremare i server di OpenAI. Quindi è frequente osservare errori, problemi di connessione, interruzioni temporanee del servizio. Non ci si può lamentare, in quanto è (ancora) un servizio completamente gratuito.

Ad oggi è stato inserito un cap giornalieroper limitare il numero di interazioni.

Scopo di ChatGPT

Secondo i programmatori di OpenAI, l’obiettivo di ChatGPT è quello di rendere i sistemi di intelligenza artificiale più facili e piacevoli da utilizzare da parte degli utenti, semplificando l’interfaccia di accesso a GPT-3, e aumentando così i feedback degli utenti (fondamentali per migliorare ulteriormente il modello e renderlo sempre più sicuro).

ChatGPT è ottimizzato per la conversazione. Il nostro obiettivo è quello di rendere l’interazione con i sistemi di IA più naturale, e il vostro feedback ci aiuterà a migliorare i nostri sistemi e a renderli più sicuri” – OpenAI

Secondo noi…ChatGPT è ottimizzato per raccogliere prompt…per ottimizzare il modello e lanciare la volata a GPT-4

Conclusione

In sintesi, ChatGPT è uno strumento molto potente e versatile che può essere utilizzato sia da chi vuole semplicemente chattare con un sistema di IA, sia da chi vuole testare nuovi prompt e sperimentare nuove forme di interazione con le IA.

Ancora non possiede API che ne consentano un uso professionale (e forse non verranno mai create), ma a tal fine è possibile utilizzare text-davinci-003 che è attualmente il migliore tra i modelli InstructGPT, e le cui performance sono equiparabili.

In conclusione, se siete interessati a scoprire di più su ChatGPT, vi invitiamo a visitare il sito ufficiale di OpenAI e a provarlo direttamente online.

Approfondimenti

  • Christiano, P. F., Leike, J., Brown, T. B., Martic, M., Legg, S., & Amodei, D. (2017). Deep reinforcement learning from human preferences. Advances in Neural Information Processing Systems2017-December, 4300–4308.
  • ChatGPT: Optimizing Language Models for Dialogue. (n.d.). from https://openai.com/blog/chatgpt/
  • Si, C., Gan, Z., Yang, Z., Wang, S., Wang, J., Boyd-Graber, J., & Wang, L. (2022). Prompting GPT-3 To Be Reliablehttps://doi.org/10.48550/arxiv.2210.09150
  • L. G., Schulman, J., Jacob, O. et al. (2022). Scaling Laws for Reward Model Overoptimizationhttps://doi.org/10.48550/arxiv.2210.10760
  • Stiennon, N., Ouyang, L., Wu, J., Ziegler, D., Lowe, R., Voss, C., … Christiano, P. F. (2020). Learning to summarize with human feedback. Advances in Neural Information Processing Systems33, 3008–3021.
https://smartstrategy.eu/intelligenza-artificiale/chat-gpt-3-come-accedere-e-testare-il-nuovo-modello-di-gpt-3/
http://altrarealta.blogspot.it/