Valutazione delle funzionalità di programmazione delle IA: Un confronto tra Gemini Pro 2.5 e altri strumenti AI
Nel contesto delle mie valutazioni delle funzionalità di codifica delle IA, sottopongo ogni intelligenza artificiale a quattro test di programmazione. Questi test sono progettati per determinare in che misura un’IA possa aiutarti nella programmazione. È molto utile, specialmente se conti sull’IA per aiutarti a produrre codice. L’ultima cosa che vuoi è che un’IA introduca bug nel tuo lavoro di sviluppatore, giusto?
Si tratta di test molto semplici, poiché utilizzo PHP e JavaScript, che non sono esattamente linguaggi difficili. E eseguo le richieste di script tramite le IA. Utilizzando esattamente gli stessi test, possiamo confrontare direttamente le prestazioni.
- Uno di essi consiste nel scrivere un semplice plugin per WordPress.
- Un altro è chiedere aiuto per riscrivere una funzione di gestione delle stringhe.
- Il terzo test è per trovare un bug che ho avuto difficoltà a individuare da solo.
- Infine, l’ultimo test usa alcuni strumenti di programmazione per recuperare dati da Chrome.
Gemini Pro 2.5 è disponibile gratuitamente per tutti
Tuttavia, è importante trattare le IA come faresti con qualcuno che impara a guidare; se non riesci a farlo uscire dal garage, non lo lascerai di certo su un’autostrada affollata.
Fino ad oggi, solo il LLM GPT-4 (e versioni successive) di ChatPlus ha superato tutti i test. Sì, anche Perplexity Pro ha superato tutti i test, ma perché utilizza il LLM GPT-4. Curiosamente, Microsoft Copilot, che usa anche il LLM di ChatPlus, ha fallito tutti i test. Anche Gemini di Google non ha ottenuto risultati molto migliori. Quando ho testato Bard (il primo nome di Gemini), ha fallito nella maggior parte dei test. L’anno scorso, quando ho testato Gemini Advanced (20 $ al mese), ha fallito in tre dei quattro test.
Oggi, Google torna con Gemini Pro 2.5. Ciò che ha attirato la nostra attenzione qui a ZDNET è che Gemini Pro 2.5 è disponibile gratuitamente, per tutti. Nessun supplemento di 20 dollari al mese. Anche se Google ha chiaramente indicato che l’accesso gratuito è soggetto a limiti tariffari, non credo che qualcuno di noi avesse realizzato che ci strangolerebbe dopo due richieste. È ciò che è successo durante i miei test.
Le mie prime due richieste chiedevano a Gemini Pro 2.5 di scrivere un plugin completo per WordPress e di correggere del codice. Potrei aver esaurito i limiti più rapidamente rispetto a se lo usassi per porre una semplice domanda. Ma con grande sorpresa, ne è valsa davvero la pena.
Test 1: Scrivere un semplice plugin per WordPress
È impressionante. Siamo lontani dal fallimento di Bard e da quello di Gemini Advanced. Gemini Pro 2.5 ha superato questo test fin dal primo tentativo.
Il compito consisteva nello scrivere un semplice plugin per WordPress che fornisse un’interfaccia utente semplice. Randomizza le righe di input e distribuisce (e non rimuove) i duplicati per fare in modo che non siano uno accanto all’altro.
Gemini Pro 2.5 mi ha fornito un’interfaccia utente molto corretta. E il codice ha funzionato come doveva.

Cattura dello schermo di David Gewirtz/ZDNET
Quello che ha attirato la mia attenzione, oltre all’interfaccia ben presentata, è stata la scelta dell’icona per il plugin. La maggior parte delle IA ignora la scelta dell’icona, lasciando che l’interfaccia si adatti di default a quanto assegnato da WordPress.
Tuttavia, Gemini Pro 2.5 ha chiaramente scelto un’icona da la selezione Dashicon di WordPress. Inoltre, quest’icona è perfettamente adatta per la randomizzazione delle righe di un plugin.
![]()
Cattura dello schermo di David Gewirtz/ZDNET
Non solo Gemini Pro 2.5 ha superato questo test, ma ha anche ricevuto un “wow” per la scelta dell’icona. Non l’ho invitato a farlo, ed è stato esattamente ciò di cui avevo bisogno. Il codice era completamente in linea (JavaScript e HTML erano incorporati nel PHP) ed era ben documentato. Inoltre, Gemini Pro 2.5 ha documentato ogni segmento principale del codice con un testo esplicativo separato.
Test 2: Riscrivere una funzione di gestione delle stringhe
Nel secondo test, ho chiesto a Gemini Pro 2.5 di riscrivere un codice per la gestione delle stringhe che trattava dollari e centesimi. Il codice di test iniziale consentiva solo numeri interi (quindi, solo dollari). L’obiettivo era consentire sia dollari che centesimi. Questo è un test che ChatPlus ha superato. Bard ha fallito inizialmente prima di riuscire.
E Google Advanced ha fallito in un modo sia sottile che pericoloso. Il codice generato da Gemini Advanced non consentiva le voci non decimali. In altre parole, 1,00 era consentito, ma non 1. Così come 20. Peggio ancora, ha deciso di limitare i numeri a due cifre prima della virgola anziché dopo, mostrando che non comprendeva il concetto di dollari e centesimi. Falliva se inserivi 100,50, ma permetteva 99,50.
Si tratta di un problema molto semplice, uno di quelli che si danno agli studenti del primo anno di programmazione. Peggio, il difetto di programmazione di Gemini Advanced è molto difficile da individuare per un programmatore.
Il codice generato da Gemini Pro 2.5 è un po’ troppo rigido
Quando ho ripetuto il test con Gemini Pro 2.5, i risultati sono stati diversi. Il codice verifica correttamente i tipi di input, rimuove gli spazi bianchi, ripara l’espressione regolare per consentire gli zeri iniziali, le voci decimali e le voci negative.
Commenta anche in modo esaustivo il codice dell’espressione regolare, fornendo un insieme completo di esempi di test ben etichettati, sia validi che non validi (e elencati come tali).
Il codice generato da Gemini Pro 2.5 è un po’ troppo rigido. Non consente di raggruppare le virgole (come in $1,245.22) e non permette neppure i simboli monetari all’inizio. Ma dato che il mio prompt non lo richiedeva, e che l’uso di virgole o simboli monetari genera un errore controllato e non un crash, considero che sia accettabile.
È una seconda vittoria.
Test 3: Trovare un bug
Passiamo ora al test di rilevamento bug. ChatPlus ha compreso il problema. Gemini Advanced non ha nemmeno provato a fornire una risposta. Ha fornito solo la raccomandazione di cercare “probabilmente altrove nel plugin o in WordPress” per trovare l’errore.
Ma oggi, con Gemini Pro 2.5? Onestamente, non lo so, e non lo saprò fino a domani. Apparentemente, ho esaurito il mio quota gratuita di Gemini Pro 2.5 con le mie prime due domande.

Cattura dello schermo di David Gewirtz/ZDNET
Quindi, tornerò domani.
D’accordo, sono di nuovo qui. È il giorno dopo, il cane ha fatto una bella passeggiata, il sole splende e Gemini Pro 2.5 mi dà di nuovo spazio per inviare messaggi. Ho dato vita alla richiesta per il mio terzo test.
Non solo ha superato il test e trovato il bug. Ma mi ha indicato il punto del codice da correggere. Letteralmente. Mi ha disegnato una mappa, con una freccia e tutto.

Cattura dello schermo di David Gewirtz/ZDNET
Con tre test corretti su quattro, Gemini Pro 2.5 esce dalla categoria “Chatbot da evitare per l’aiuto alla programmazione” e entra nella prima metà della nostra classifica.
Ma rimane ancora un test. Vediamo come se la cava Gemini Pro 2.5.
Test 4: Scrivere uno script
Quest’ultimo test non è molto difficile in termini di competenze di programmazione. Ciò che testano è la capacità dell’IA di passare da un ambiente all’altro, così come l’oscura comprensione degli ambienti di programmazione.
Il test richiede:
- Comprendere la rappresentazione interna del modello dell’oggetto in Chrome
- Imparare a scrivere in AppleScript (che è molto più oscuro rispetto, ad esempio, a Python)
- Scrivere codice per Keyboard Maestro, uno strumento per la creazione di macro scritto da un australiano
La routine è progettata per aprire le schede di Chrome e impostare la scheda attiva su quella utilizzata come parametro. Si tratta di un requisito di codifica abbastanza specifico. Ma è esattamente il tipo di cosa che potrebbe richiedere ore per essere risolto manualmente, poiché si basa sulla comprensione dei parametri giusti per ogni ambiente.
La maggior parte delle IA si comporta bene con il collegamento tra AppleScript e Chrome. Ma più della metà di esse non sa come trasmettere parametri a Keyboard Maestro.
E di nuovo, wow. Gemini Pro 2.5 ha effettivamente compreso Keyboard Maestro. Ha scritto il codice necessario per trasmettere le variabili correttamente. Ha aggiunto valore controllando gli errori e avvisando l’utente (cosa non richiesta nel prompt) se la variabile non poteva essere impostata.
Inoltre, più avanti nella sezione di spiegazione, ha persino fornito i passaggi necessari per configurare Keyboard Maestro affinché funzioni in questo contesto.

Cattura dello schermo di David Gewirtz/ZDNET
È così, signore e signori, che Gemini Pro 2.5 entra nel ristretto circolo dei vincitori.
Lo sapevamo che sarebbe successo
Era solo una questione di tempo. Google è pieno di persone molto, molto intelligenti. Infatti, è Google che ha dato inizio al boom dell’IA generativa nel 2017 con il suo documento di ricerca “L’attenzione è tutto ciò di cui hai bisogno“.
Bard, Gemini e anche Gemini Advanced hanno fallito miseramente nei miei test di programmazione IA. Ma era solo una questione di tempo prima che l’IA di Google raggiungesse le offerte di OpenAI.
Quel momento è arrivato. Almeno per i miei test di programmazione. Gemini Pro 2.5 è più lento di ChatPlus Plus. ChatPlus Plus risponde quasi istantaneamente. Gemini Pro 2.5 sembra prendere tra 15 secondi e un minuto.
Tuttavia, aspettare qualche secondo per ottenere un risultato preciso e utile è molto più prezioso che ricevere immediatamente risposte errate.
Fonte : www.zdnet.fr
Il gigante americano dell’e-commerce entra nella corsa all’IA insieme a OpenAI, Google e Apple: dopo vari rinvii, annuncia il lancio di Alexa+, la versione IA generativa del suo assistente vocale. L’offerta non è ancora disponibile in Europa.
Da anni il gigante dell’e-commerce Amazon sta lavorando su una versione potenziata con IA di Alexa, l’assistente personale vocale lanciato sul mercato nel 2014. Annunciata con grande clamore nel settembre 2023, la versione IA di Alexa doveva essere lanciata nell’estate del 2024, prima di essere promessa per il 2025. Ora è finalmente realtà: mercoledì 26 febbraio, il gruppo americano ha lanciato Alexa+, un concorrente di ChatPlus e Gemini, « facile da usare, più intelligente che mai e sempre accessibile », ha dichiarato Panos Pany, a capo dell’hardware di Amazon, durante una presentazione a New York.
Il gruppo sottolinea una « ristrutturazione completa » di Alexa. La sua versione potenziata con IA generativa selezionerà il modello di IA più adatto per rispondere alle richieste degli utenti, come Amazon Nova, il modello linguistico interno del colosso americano, o Claude, l’IA di Anthropic con cui la società ha una partnership. Ora, Alexa+ sarà in grado di prenotare ristoranti o trovare passaggi specifici in un film, come mostrato dal gruppo durante la presentazione. Ma non è tutto.
Amazon promette conversazioni approfondite con Alexa+
La nuova versione IA dell’assistente vocale sarà in grado di funzionare con altre piattaforme e controllare vari dispositivi connessi, simile a servizi come Spotify, Apple Music, Netflix, Disney+, Uber, … Alexa+ sarà capace di analizzare una scena se è dotata di una telecamera connessa. L’assistente di Amazon potrà anche comprendere il contesto di un utente, incluso il suo stato emotivo, e rispondere di conseguenza, afferma il colosso. Il gigante americano promette conversazioni approfondite con Alexa+.
Per utilizzarla e provarla, ci sono diverse possibilità: è sufficiente interagire tramite un dispositivo Echo. Ma Alexa+ sarà accessibile anche attraverso un nuovo portale web e un’applicazione aggiornata.Amazon sta quindi prendendo la strada dell’IA generativa destinata al grande pubblico, mesi dopo i suoi concorrenti. Google ha dotato i suoi dispositivi connessi del suo assistente vocale IA Gemini, mentre Siri di Apple è stato potenziato con ChatPlus. Era dunque tempo che la divisione dei dispositivi elettronici offrisse un agente conversazionale potenziato con IA.
Tuttavia, sarà necessario pazientare per utilizzare questa nuova versione, poiché Alexa+, che attualmente risponde solo in inglese, sarà disponibile solo negli Stati Uniti a partire dal mese di marzo. Per gli abbonati Amazon Prime, non è richiesto alcun supplemento. Per gli altri, sarà necessario pagare la somma di 19,99 dollari al mese per accedervi. Non è stata annunciata alcuna data per il lancio internazionale.
Fonte: www.01net.com
Ora disponibile su Hugging Face, SynthID Text consente agli sviluppatori di applicare una filigrana invisibile sui testi generati da un’IA. Sebbene lo strumento non sia infallibile, Google spera che contribuirà a limitare la disinformazione prodotta da Gemini e simili..
Che sia voluto o meno, le IA come ChatPlus rischiano di diffondere sempre di più disinformazione // Fonte: Hartono Creative Studio via UnsplashI testi generati da ChatPlus o Claude sono onnipresenti. Nelle nostre comunicazioni professionali, nelle recensioni sulle piattaforme di e-commerce e inevitabilmente negli articoli pubblicati da alcuni media. Queste nuove intelligenze artificiali, pur essendo pratiche, presentano alcuni difetti importanti: sono lontane dall’essere infallibili e facilitano enormemente la diffusione di informazioni errate.
Le soluzioni per porvi rimedio non sono molte. Sebbene alcune aziende si sforzino di sviluppare strumenti per rilevare i contenuti generati da IA, questi sono imprecisi e possono anche accusare testi scritti da esseri umani.
Tuttavia, è possibile per gli sviluppatori applicare un filigrana sui contenuti generati dall’IA. Questo è il ruolo di SynthID Text di DeepMind, filiale di Google, che permette di identificare in modo invisibile per i lettori i risultati testuali prodotti dall’intelligenza artificiale.
Per fare ciò, lo strumento modifica leggermente il funzionamento delle IA, influenzando i token (o “gettoni”) che consentono loro di indovinare le parole o le lettere che devono apparire man mano che elaborano il testo. Ne risulta un modello riconoscibile da SynthID Text, che “non compromette la qualità, la precisione, la creatività o la rapidità della generazione del testo”, secondo quanto dichiarato da DeepMind in un post sul blog.
Un testo generato da Gemini con il filigrana di SynthID Text evidenziato in blu // Fonte: DeepMind
Uno strumento che non è infallibile, ma che potrebbe diventare obbligatorio
Ovviamente, SynthID Text non è privo di difetti. DeepMind sottolinea che “funziona meglio quando un modello linguistico genera risposte lunghe”. È in grado di rilevare anche testi parafrasati, ma inizia a mostrare i suoi limiti con risposte brevi, traduzioni o risposte molto fattuali. I testi che sono stati riscritti da esseri umani possono anche influire sulle prestazioni dello strumento.
Questo strumento è integrato di fatto in Gemini dalla scorsa primavera, ed è ora disponibile gratuitamente per sviluppatori e aziende sulla piattaforma Hugging Face. Se al momento queste non sono obbligate a utilizzare tali strumenti nei loro processi, alcuni regolatori potrebbero costringerle a farlo nei prossimi mesi e anni, in particolare in California, come riportato da TechCrunch.
E potrebbe trattarsi di una vera e propria urgenza. Secondo uno studio di Europol, entro il 2026 ben il 90% dei contenuti su Internet potrebbe essere generato dall’intelligenza artificiale. Un dato assolutamente sconvolgente, che mette a rischio la nostra capacità, come utenti di Internet, di verificare la veridicità delle informazioni che raccogliamo qua e là sul web.
Resta da vedere chi, tra Google e OpenAI, che da alcuni anni sta lavorando a uno strumento simile a SynthID Text, riuscirà a imporre il proprio standard per quanto riguarda la questione dei filigrani.
Fonte: www.frandroid.com
Talento, creatività, professionalità e tanto coraggio. Sono le doti degli startupper della Campania, terzi in Italia, dopo Lombardia e Lazio, per numero di progetti innovativi nel 2023 (ben 1.475), ma primi per trend di crescita degli ultimi dodici mesi con +5.2%. Risultati ottimi grazie a un ecosistema vasto e ben sostenuto dalla Regione Campania, che con l’assessorato alla Ricerca, Innovazione e Startup, sta investendo con ingenti finanziamenti per sostenere le nuove iniziative, trainando così l’intero settore, che si fortifica di anno in anno.
Un altro primato della Campania è per start up di giovani sotto i 30 anni ed è prima anche per brevetti registrati e per numero di ricercatori ed è prima anche per imprenditorialità giovanile. Ecco perché la finale di Start Cup Campania 2024, la piu longeva competizione tra i progetti d’impresa innovativa in ambito universitario, è da tenere d’occhio per i contenuti proposti da cui potrebbero nascere nuove startup. Oggi all’Auditorium Sant’Agostino dell’Università degli Studi del Sannio, si terrà la finale dell’iniziativa che ha come protagonisti tutti e sette gli atenei regionali: Federico II, Vanvitelli, Parthenope, Suor Orsola Benincasa, Sannio, Salerno e L’Orientale. L’obiettivo è realizzare una business plan competition tra i partecipanti che dovranno presentare idee imprenditoriali basate su ricerca e innovazione tecnologica finalizzate allo sviluppo economico e alla nascita di imprese ad alto contenuto di conoscenza. Alla gara possono concorrere docenti, ricercatori, dottorandi, titolari di assegni di ricerca, diplomati, laureati, dottori di ricerca, che abbiano conseguito il titolo in una delle Università promotrici dell’iniziativa nell’ultimo quinquennio, oppure studenti iscritti, e personale tecnico-amministrativo.
Il record di Start Cup Campania 2024
Undici i progetti finalisti che si contenderanno oggi il premio più ambito per chi fa innovazione, selezionati da una giuria tecnica per l’innovazione proposta e il potenziale impatto sul territorio, coprendo settori che spaziano dalla tecnologia alla sostenibilita e ai servizi alla persona. L’edizione 2024, diretta dal docente Marco Consales dell’Università del Sannio, ha fatto segnare una partecipazione record: 61 i business plan presentati, con un incremento di oltre il 50% rispetto all’edizione del 2023. Circa 300 il numero totale di partecipanti da cui sono stati selezionati i finalisti in gara oggi. Il direttivo di StartCup Campania è composto oltre che da Consales dal vicedirettore Pierluigi Rippa, Roberto Cerchione, Domenico Salvatore, Giuseppe Lucio Gaeta, Francesca Michelino e Luigi Zeni. Le prime cinque posizioni, oltre a premi in denaro, consentiranno accesso alla finale di Innovation Village Award e alla finale nazionale del PNICube. Sono previsti, inoltre, cinque premi speciali: Premio Speciale Studenti Mario Raffa, dedicata al professore federiciano tra i principali fautori di Start Cup Campania; Premio Speciale Imprenditoria femminile Enza Cappabianca; Premio Speciale per l’Innovazione Culturale; Premio Speciale Climate Change che consentirà anche l’accesso alla finale del PNI 2024; e Premio Speciale Social Innovation.
Tutti i progetti di Start Cup Campania 2024
Tra i finalisti di Start Cup Campania 2024 troviamo sei progetti proposti dall’Università degli Studi di Napoli Federico II. Si tratta di Ai.res, un provider di soluzioni di governance per aziende che sviluppano e/o utilizzano sistemi basati sull’Intelligenza Artificiale, soprattutto se in domini high-risk. C’è poi Billd che grazie al suo dispositivo brevettato (Trl 7), lancia sul mercato un servizio di scontrino digitale dedicato alle micro, piccole e medie imprese. Oltre a portare un’innovazione tecnologica, si impegna a eliminare l’impatto ambientale causato dall’utilizzo della carta termica degli attuali scontrini. Bloom propone soluzioni innovative per il risparmio energetico e l’efficienza attraverso biostimolanti e bioplastica derivanti da biomasse microalgali cresciute in reflui zootecnici. G.R.E.T.A. nata come primo spin off umanistico attivato nel Dipartimento di Studi Umanistici federiciano, vuole sviluppare soluzioni innovative con un e-content mix di edutainment, storytelling, gamification e comunicazione, finalizzati all’accessibilità e alla valorizzazione del patrimonio culturale per un pubblico cross-over, soprattutto bambini con Bes. Oris care, iniziativa imprenditoriale dedicata alla cura della persona attraverso tecnologie digitali. E infine Ridesense tecnologia HW-SW per migliorare la sicurezza e l’efficienza dei veicoli autonomi tramite algoritmi real-time. Tre i progetti dell’Università degli Studi di Salerno tra cui Better Gush, una borraccia innovativa per raccolta e riutilizzo dell’acqua. C’è poi VarisCup, per migliorare l’efficienza energetica nelle industrie.
Infine Prof. Alfred, servizio didattico che tramite l’IA supporta gli studenti nella preparazione agli esami fornendo feedback personalizzati e aiuta a ridurre l’ansia da esame. Matidia Pharma s.r.l. è il progetto finalista dell’Università degli Studi della Campania Luigi Vanvitelli, una startup che sviluppa soluzioni per il trattamento di malattie rare. Uno screening di molecole innovative e composti antimicrobici a base di estratti naturali e peptidi, sviluppo di dispositivi medici, fitofarmaci e prodotti di uso cosmetico impiegando tecniche di biologia molecolare, cellulare, del Dna ricombinante, di biotecnologie avanzate, della medicina di laboratorio e della farmacologia. L’ultima startup finalista è McSteam proposta dall’Università degli Studi del Sannio, spin-off universitario che propone dispositivi medici innovativi per lo studio in vitro dei meccanismi delle cellule su come percepiscono e rispondono ai segnali meccanici ambientali.
Fonte: www.ilmattino.it






