OpenAI introduce Canvas, una nuova interfaccia per lavorare con ChatGPT su progetti di scrittura e programmazione che vanno oltre la semplice chat. Canvas si apre in una finestra separata, permettendo all’utente e a ChatGPT di collaborare su un progetto. Questa beta iniziale, ossia una versione preliminare del prodotto rilasciata per testarne le funzionalità e raccogliere feedback dagli utenti, introduce un nuovo modo di lavorare insieme, non solo attraverso la conversazione, ma creando e perfezionando idee fianco a fianco.
Canvas è stato costruito con GPT-4o e può essere selezionato manualmente nel selettore del modello mentre è in beta.
Canvas è disponibile per gli utenti di ChatGPT Plus e Team a livello globale. Gli utenti Enterprise ed Edu avranno accesso dal 7 ottobre 2024. Inoltre, OpenAI prevede di rendere Canvas disponibile a tutti gli utenti ChatGPT Free una volta che uscirà dalla fase beta.
Una migliore collaborazione con ChatGPT
Le persone utilizzano ChatGPT ogni giorno per assistenza nella scrittura e nella programmazione. Sebbene l’interfaccia chat sia facile da usare e funzioni bene per molti compiti, è limitata quando si desidera lavorare su progetti che richiedono modifiche e revisioni. Canvas offre una nuova interfaccia per questo tipo di lavoro.
Con Canvas, ChatGPT può comprendere meglio il contesto di ciò che l’utente sta cercando di realizzare. Si possono evidenziare sezioni specifiche per indicare esattamente su cosa si vuole che ChatGPT si concentri. Come un editor o revisore del codice, può fornire feedback e suggerimenti inline con l’intero progetto in mente.
L’utente controlla il progetto in Canvas. Può modificare direttamente testo o codice. C’è un menu di scorciatoie per chiedere a ChatGPT di regolare la lunghezza della scrittura, eseguire il debug del codice e svolgere rapidamente altre azioni utili.
Si possono anche ripristinare versioni precedenti del lavoro utilizzando il pulsante indietro in Canvas.
Canvas si apre automaticamente quando ChatGPT rileva uno scenario in cui potrebbe essere utile. Si può anche includere “usa Canvas” nel proprio prompt per aprire Canvas e utilizzarlo per lavorare su un progetto esistente.
Le scorciatoie di scrittura includono:
- Suggerire modifiche: ChatGPT offre suggerimenti e feedback inline.
- Regolare la lunghezza: modifica la lunghezza del documento per renderlo più corto o più lungo.
- Cambiare il livello di lettura: regola il livello di lettura, da scuola dell’infanzia a scuola di specializzazione.
- Aggiungere rifiniture finali: controlla grammatica, chiarezza e coerenza.
- Aggiungere emoji: aggiunge emoji rilevanti per enfasi e colore.
La programmazione in Canvas
La programmazione è un processo iterativo, e può essere difficile seguire tutte le revisioni del codice in chat. Canvas rende più facile tracciare e comprendere le modifiche di ChatGPT, e si prevede di continuare a migliorare la trasparenza in questo tipo di modifiche.
Scorciatoie di programmazione includono:
- Rivedere il codice: ChatGPT fornisce suggerimenti inline per migliorare il codice.
- Aggiungere log: inserisce istruzioni di stampa per aiutare a eseguire il debug e comprendere il codice.
- Aggiungere commenti: aggiunge commenti al codice per renderlo più comprensibile.
- Correggere errori: rileva e riscrive codice problematico per risolvere errori.
- Portare a un linguaggio: traduce il codice in JavaScript, TypeScript, Python, Java, C++ o PHP.
Addestrare il modello a diventare un collaboratore
Il modello GPT-4o è stato addestrato per collaborare come partner creativo. Il modello sa quando aprire un Canvas, effettuare modifiche mirate e riscrivere completamente. Comprende anche un contesto più ampio per fornire feedback e suggerimenti precisi.
Per supportare questo, un team di ricerca ha sviluppato i seguenti comportamenti fondamentali:
- attivare il Canvas per scrittura e programmazione
- generare tipi di contenuti diversi
- effettuare modifiche mirate
- riscrivere documenti
- fornire critiche inline.
Il progresso è stato misurato con oltre 20 valutazioni interne automatizzate. Sono state utilizzate tecniche innovative di generazione di dati sintetici, come la distillazione di output da OpenAI o1-preview, per addestrare il modello sui suoi comportamenti fondamentali. Questo approccio ha permesso di migliorare rapidamente la qualità della scrittura e le interazioni con gli utenti, senza affidarsi a dati generati dall’uomo.
Una sfida chiave è stata definire quando attivare un Canvas. Il modello è stato addestrato ad aprire un Canvas per prompt come “Scrivi un post sul blog sulla storia dei chicchi di caffè”, evitando di attivarlo eccessivamente per compiti generali di domande e risposte, come “Aiutami a cucinare una nuova ricetta per cena”.
Per i compiti di scrittura, è stata data priorità al miglioramento dei “trigger corretti”, raggiungendo l’83% rispetto a una baseline zero-shot GPT-4o con istruzioni prompt.
È importante notare che la qualità di tali baseline è altamente sensibile al prompt specifico utilizzato. Con prompt diversi, la baseline può ancora funzionare male, risultando in diverse forme di prestazioni sub-ottimali.
Per la programmazione, è stato intenzionalmente dato un bias al modello contro l’attivazione, per evitare di disturbare gli utenti più esperti. Si continuerà a perfezionare questo aspetto basandosi sul feedback degli utenti.
Decisione di Canvas: scrittura e programmazione
Per i compiti di scrittura e programmazione, è stato migliorato il corretto innesco del confine decisionale del Canvas, raggiungendo rispettivamente l’83% e il 94% rispetto a una baseline zero-shot GPT-4o con istruzioni prompt.
Una seconda sfida ha riguardato la regolazione del comportamento di modifica del modello una volta attivato il Canvas, in particolare decidendo quando effettuare una modifica mirata rispetto a riscrivere l’intero contenuto. Il modello è stato addestrato a eseguire modifiche mirate quando gli utenti selezionano esplicitamente il testo attraverso l’interfaccia, altrimenti favorendo le riscritture.
Questo comportamento continua a evolversi man mano che il modello viene perfezionato.
Modifiche di Canvas: scrittura e programmazione
Per i compiti di scrittura e programmazione, è stata data priorità al miglioramento delle modifiche mirate del Canvas. GPT-4o con Canvas esegue meglio di una baseline GPT-4o con prompt del 18%.
Infine, l’addestramento del modello per generare commenti di alta qualità ha richiesto un’attenta iterazione. A differenza dei primi due casi, facilmente adattabili alla valutazione automatizzata con revisioni manuali approfondite, misurare la qualità in modo automatizzato è particolarmente difficile. Pertanto, sono state utilizzate valutazioni umane per valutare la qualità e l’accuratezza dei commenti.
Il modello integrato con Canvas supera il GPT-4o zero-shot con istruzioni prompt del 30% in accuratezza e del 16% in qualità, dimostrando che l’addestramento sintetico migliora significativamente la qualità e il comportamento delle risposte rispetto al prompting zero-shot con istruzioni dettagliate.
Considerazioni finali
Canvas segna un importante passo avanti nell’interazione con ChatGPT, offrendo una modalità di lavoro che combina la potenza dell’intelligenza artificiale con un’interfaccia grafica intuitiva e flessibile. L’approccio visivo consente agli utenti di esplorare nuove possibilità, passando da una semplice interazione testuale a una gestione più strutturata delle idee e dei flussi di lavoro.
Questa nuova funzione non solo semplifica l’organizzazione delle conversazioni, ma facilita la creazione di progetti complessi, permettendo di visualizzare le relazioni tra diverse parti del contenuto. Che si tratti di brainstorming, pianificazione di strategie o creazione di documenti collaborativi, Canvas si propone come uno strumento innovativo per aumentare la produttività e migliorare il processo creativo.
Grazie a questa evoluzione, ChatGPT diventa ancora più versatile, adattandosi meglio alle esigenze di professionisti e team che vogliono sfruttare l’intelligenza artificiale in modo più dinamico ed efficace. Canvas rappresenta un invito a ripensare come collaboriamo con le AI, trasformandole in alleati ancora più strategici e capaci.