AI generativa: trend, strumenti, consigli
Intervista a Valerio Mariani, AI developer Geckosoft
Nell’anno in cui l’intelligenza artificiale generativa è arrivata al grande pubblico è arrivato in squadra un gecko specialista in AI. Si chiama Valerio Mariani e gli abbiamo chiesto di raccontarci il suo punto di vista in proposito: quali sviluppi per l’intelligenza artificiale, quali strumenti usa, come non usare ChatGPT, come usarlo e quali altri strumenti di AI generativa possono aiutarci nel business, ma anche nello studio e, in generale, nella vita quotidiana.
Iniziamo da uno strumento che conosciamo in tanti e di cui abbiamo già parlato in più di un’occasione nel nostro blog (in particolare qui e qui). Quale consiglio daresti a chi usa ChatGPT?
Per rispondere voglio scomodare Albert Einstein, il quale diceva: “I computer sono incredibilmente veloci, accurati e stupidi. Gli uomini sono incredibilmente lenti, inaccurati e intelligenti. L’insieme dei due costituisce una forza incalcolabile”. Ecco, il consiglio che più di tutti mi sento di dare è quello di non lasciare mai le redini dell’intelligenza umana, e quindi di non trattare ChatGPT come se fosse l’oracolo di Delfi, come invece potrebbe facilmente accadere visti i risultati strabilianti che riesce a produrre. Soprattutto a un occhio poco esperto. ChatGPT va trattato come uno strumento di lavoro, un robot vagamente scemo ma molto volenteroso. Del resto è un consiglio che vale un po’ per tutti gli strumenti di intelligenza artificiale.
Anche perché, per quanto famoso, non c’è solo ChatGPT. Esistono moltissimi altri strumenti di intelligenza artificiale generativa. Io, personalmente, preferisco Bing di Microsoft, che usa lo stesso modello ma in un modo diverso, per esempio fornendo le fonti delle risposte (è un motore di ricerca dopotutto!), oppure Bard di Google. Ma c’è un’infinità di possibilità, già tranquillamente utilizzabili nella quotidianità, nello studio o nel lavoro.
A questo proposito, quali altri strumenti di AI generativa ti vengono in mente?
Ecco un mio personalissimo e non esaustivo elenco di tool di intelligenza artificiale e luoghi online di interesse per chi è appassionato di AI e Machine learning.
- Github Copilot é un tool di cui si sente parlare sempre di più, e che personalmente uso parecchio per programmare. Rispetto ad altri strumenti, tende a essere meno invasivo, nel senso che raramente pretende di scrivere grossi pezzi di codice al posto tuo. Funziona come auto-completamento del tuo lavoro di programmazione. In questo incarna esattamente l’idea che ho io dell’intelligenza artificiale, ovvero di quella che potremmo definire una pedalata assistita.
- Midjourney é uno strumento per la generazione di immagini che sta prendendo sempre più spazio, e che nei mesi scorsi è stato oggetto di una provocazione da parte di un fotografo, Boris Eldagsen, che l’ha usato per generare un’immagine fotografica vincendo (e poi rifiutando) un prestigioso premio internazionale di fotografia, con lo scopo di aprire il dibattito sull’uso dell’AI generativa nella produzione artistica e culturale. Insomma, come gli altri tool di AI generativa, anche Midjourney, a seconda di come lo usi può essere molto interessante o molto controverso.
- SAM – Segment Anything Model è un modello recentemente rilasciato da Facebook, estremamente potente per estrarre il contenuto delle immagini, e tracciare il punto esatto in cui si posiziona qualcosa che stiamo cercando.
- OpenAI CLIP per la classificazione delle immagini.
- OpenAI Whisper per trascrivere il testo da video o file audio.
- Google FlanUL2 modello generativo del linguaggio.
- BigScience Bloomz altro modello generativo del linguaggio, fino a 176B parametri, paragonabile a GPT-3).
- Google Pix2Struct interpreta documenti, può trascrivere, rispondere a domande, e fare un sacco di altre cose.
Dove sta andando l’intelligenza artificiale?
Osservando quello che sta succedendo e ascoltando le dichiarazioni delle personalità che stanno guidando lo sviluppo delle intelligenze artificiali, penso di poter delineare due trend principali che vedremo nel prossimo futuro. Da un lato stiamo assistendo a una riduzione delle dimensioni dei modelli di AI generativa e, dall’altro, a un sempre maggiore sviluppo dell’AI open source, il che rende meno probabile il rischio di un controllo di questa tecnologia da parte di poche grandi aziende.
- Sulla riduzione delle dimensioni dei modelli futuri di AI generativa è intervenuto addirittura Sam Altman, CEO di OpenAI dicendo “Penso che siamo alla fine dell’era in cui ci saranno questi modelli giganti e che li miglioreremo in altri modi” e ancora “Penso che sia importante concentrarsi sulla rapida crescita delle capacità. E se c’è qualche ragione per cui il numero di parametri deve diminuire nel tempo, o se dobbiamo avere più modelli che lavorano insieme, ognuno dei quali è più piccolo, lo faremo. Quello che vogliamo consegnare al mondo sono i modelli più capaci, utili e sicuri. Non siamo qui per farci le seghe mentali sul conteggio dei parametri”. 1
Non solo, fra gli addetti ai lavori si parla sempre di più di “distillazione” una tecnica usata per allenare un modello più piccolo a partire da un modello di AI generativa più grande e potente, con l’obiettivo di avere a disposizione dati “virtualmente perfetti”.Ecco, stiamo arrivando a un periodo storico in cui la dimensione del modello passa gradualmente in secondo piano, a favore dell’attenzione alla qualità del dato. E dove, modelli giganteschi come ChatGPT lasceranno sempre più spazio a strumenti più piccoli e dedicati, che gireranno direttamente sul singolo hardware, anche senza connessione a internet. - Sul fronte della “liberalizzazione” dello sviluppo dell’intelligenza artificiale generativa non posso non citare Huggingface, un grande hub di modelli (reti neurali) open source. Da qui tutti possono scaricare modelli pre-allenati e usarli liberamente, anche sul proprio hardware o sul proprio cloud. In base alla licenza anche per scopi commerciali.Questa è una possibilità enorme, perché l’uso richiede skill di programmazione piuttosto basilari, e dà accesso a modelli potentissimi. Inoltre, sono disponibili anche dataset e un sacco di altre cose (ad esempio quantizzazione e PEFT, che permettono di fare cose molto grandi con computer molto piccoli). Tutto questo dà grande spazio allo sviluppo di nuove app senza dipendere da una big tech come OpenAI. A questo proposito Open Assistant credo sia un bellissimo esempio.Sempre sul fronte dello sviluppo c’è un trend per cui le grandi aziende pubblicano un sacco di ricerca su Arxiv. Insomma, per chi è interessato al funzionamento dell’AI e si sente di approfondire un pochino la matematica che la sostiene, questo è un bellissimo momento storico. L’AI è un campo in cui si possono fare un sacco di cose nuove e interessanti.
Fonte: https://techcrunch.com/2023/04/14/sam-altman-size-of-llms-wont-matter-as-much-moving-forward/
Di cosa ti stai occupando in Geckosoft?
Sono coinvolto in progetti in cui intelligenza artificiale e machine learning possono fare la differenza nelle soluzioni digitali che proponiamo ai nostri clienti e in generale al mondo del business e delle istituzioni. Nello specifico ho collaborato allo sviluppo di un nuovo prodotto Geckosoft, che si chiama Rationale AI, uno strumento capace di estrarre, elaborare e rendere particolarmente efficaci i dati di qualsiasi organizzazione, e di fornire risposte mirate, automatizzate e cucite su ogni specifico contesto.
Una soluzione che verrà lanciata questo autunno e su cui torneremo presto a parlare. Nel frattempo abbiamo messo online un sito per approfondire: rationaleai.app.