Sito indipendente • Fatturazione P.IVA Italiana • Alta Disponibilità

La Necessità di un’Indipendenza Tecnologica in Europa

Cento aziende tecnologiche e organizzazioni europee hanno scritto alla Presidente della Commissione Europea, Ursula von der Leyen, evidenziando la necessità di una maggiore autosufficienza tecnologica europea, esortandola a creare un fondo sovrano per le infrastrutture tecnologiche al fine di incrementare gli investimenti pubblici nelle tecnologie all’avanguardia. Tra loro: Aruba, Proxima Fusion, Cubbit, OVH Cloud, Proton, Sopra Steria, Airbus, Dassault Systemes e ancora European Software Institute, European Startup Network, Italian Tech Alliance.

Nella lettera, le startup e le organizzazioni, che hanno dato vita all’iniziativa EuroStack, sottolineano come gli sviluppi geopolitici recenti rilevino l’urgenza per l’Europa di agire per mantenere la propria autonomia strategica nei settori chiave del digitale: dalla connettività al cloud, all’intelligenza artificiale fino alle piattaforme.

L’Europa si trova in una posizione di ritardo significativo nello spazio digitale e, se non si interviene rapidamente, il rischio evidente è che nei prossimi tre anni la dipendenza del Continente da tecnologie non europee – in primis americane e cinesi – diventerà quasi totale. “La visione è di sostenere l’imprenditorialità e la competitività europea (un ecosistema formato da aziende, pmi e startup), creare resilienza, proteggere la nostra autonomia e sovranità in un mondo volatile, dando potere a persone e aziende d’Europa”.

È Necessaria un’Indipendenza Digitale

Il cloud occupa un posto centrale nel documento inviato a Bruxelles. I firmatari chiedono all’Ue innanzitutto di sostenere lo sviluppo di requisiti armonizzati per gli utenti di cloud pubblico/privato affinché optino per l’utilizzo di “servizi cloud sovrani” per l’archiviazione dei propri dati sensibili, il che è anche da considerarsi come una misura di sicurezza ulteriore per proteggersi dalle leggi extraterritoriali non UE, che potrebbero rappresentare un rischio per i dati europei. Il contesto geopolitico attuale, sta spingendo l’UE a rafforzare le proprie capacità strategiche. Tant’è che proprio all’inizio di marzo, l’Unione ha proposto misure fiscali per mobilitare 800 miliardi di euro, destinati in gran parte all’aumento della spesa per la Difesa e alla resilienza economica, il “ReArm Europe”. Abbiamo raggiunto Alessandro Cillario, Ceo di Cubbit, tra le aziende italiane firmatarie dell’iniziativa EuroStack. La scaleup bolognese si occupa di sovranità dei dati dal 2016, ha più di 350 clienti ed è supportata da partnership internazionali come Exclusive Networks e Leonardo. Ad oggi conta su una squadra di 50 persone e si sta espandendo velocemente in Europa, Gran Bretagna e USA.

Cillario, perché avete deciso di aderire all’iniziativa EuroStack, quanto è importante?

“Partiamo da un dato: nel 2017 i provider europei di servizi cloud coprivano con i loro servizi il 30% del mercato nel continente. In meno di dieci anni sono crollati al 10%, nonostante il mercato continui a crescere. Se continuiamo così, nell’arco di qualche anno scompariranno. Le cause sono molteplici, ma la principale è che nell’ultimo decennio come europei abbiamo abdicato al nostro compito di creare, investire e acquistare tecnologie europee. È tempo di invertire la rotta, EuroStack va in questa direzione, in perfetto allineamento con quanto affrontato anche dal rapporto Draghi: c’è uno svantaggio competitivo da recuperare causato da regolamentazioni eccessive, frammentazione del mercato e scarsi investimenti.

Questo tema interessa tutti, perché la perdita di competitività equivale anche a una perdita di valore per il nostro sistema produttivo. Se non nascono campioni europei, perdiamo talenti che vanno all’estero, perdiamo know-how tecnologico, e soprattutto perdiamo lavori di qualità e crescita economica. Come europei non abbiamo realmente beneficiato della crescita economica portata dal digitale negli ultimi vent’anni, e molto di questo dipende proprio dal fatto che non ci siamo ritagliati un nostro ruolo nel settore della tecnologia”.

Perché è cruciale promuovere investimenti in tecnologie europee in questa fase?

“La sovranità digitale è la capacità di mantenere indipendenza tecnologica e sui propri dati. Questo non è solo un tema per esperti del settore, è nell’interesse di tutti, perché garantisce stabilità economica, potenziale di innovazione e indipendenza geopolitica. Faccio un rapido esempio che ha impattato la vita di tutti noi: durante gli anni della pandemia da Covid, abbiamo dovuto affrontare una forte carenza di mascherine e abbiamo scoperto che erano tutte prodotte in Cina. Lo stesso è accaduto poi con i vaccini, che le grandi nazioni del mondo si sono contese, negoziando con le case farmaceutiche. Ora dobbiamo chiederci: cosa succederà se la prossima carenza riguarderà i semiconduttori per i data center, che sono prodotti a Taiwan e che saranno colpiti da una potenziale guerra con la Cina? C’è qualche possibilità che le aziende straniere che gestiscono il 90% dei nostri dati sui loro server si concentreranno sulla conservazione dei data center europei invece, che su quelli presenti nei loro paesi di origine? La risposta è no. E se non abbiamo player europei forti in questo settore, saremo molto più vulnerabili e nelle mani di qualche Ceo che si trova a migliaia di chilometri di distanza oltre oceano.”

In che modo l’Europa può diventare più indipendente dal punto di vista tecnologico?

“Dobbiamo creare, investire, ma soprattutto acquistare tecnologia europea. Solo così possono nascere grandi aziende nel settore. Le aziende crescono perché creano prodotti di valore per i clienti e quindi generano ricavi. Questa è l’unica strada per attrarre capitali d’investimento che ne rafforzino la crescita. Dobbiamo aumentare la domanda di tecnologia europea, è un win-win-win: rafforziamo la nostra indipendenza tecnologica e la nostra sovranità, facciamo crescere aziende europee forti che attraggono talenti e rafforzano l’economia, generiamo valore che viene redistribuito nel nostro continente e che non finisce all’estero. Ma siamo anche consapevoli che da ogni minaccia, ci sia sempre un’opportunità. Nelle ultime settimane stiamo ricevendo sempre più chiamate da CIO e Responsabili IT italiani ed europei fortemente preoccupati per quello che sta succedendo: tutti stanno lavorando a una strategia per limitare la loro dipendenza e diversificare il rischio. Sono consapevoli che, senza i dati, le loro aziende non hanno futuro.”

Quali sono le azioni concrete di Cubbit in questa fase storica?

“Vogliamo creare uno stack software europeo a partire dal settore dello storage dei dati. L’unico modo per farlo non è inseguire gli americani, ma creare innovazioni che superino i loro modelli tecnologici. Per questo abbiamo sviluppato in anni di lavoro un modello di geo-distribuzione delle informazioni che garantisce più sicurezza, ma anche costi più competitivi rispetto ai servizi tradizionali. Il risultato è che oggi siamo l’unica soluzione software europea in questo ambito. La verità è che abbiamo ricevuto diverse proposte per trasferirci all’estero: questo avrebbe senz’altro accelerato la nostra crescita, ma avrebbe impoverito l’ecosistema italiano, che invece è quello che ci interessa. Abbiamo attratto noi capitali e talenti internazionali in Italia, invece che andarcene. E i frutti stanno arrivando: oltre alle nostre partnership con Leonardo e con WIIT, che continuano a crescere, ci sono progetti strategici con importanti organizzazioni a cui stiamo lavorando e che racconteremo nei prossimi mesi. Vogliamo essere protagonisti nella catena del valore dell’industria italiana e europea.”

Fonte: www.repubblica.it

Alla ricerca di un modello economico sostenibile, l’azienda dietro ChatPlus sta valutando la creazione di formule di abbonamento mensile a prezzi mai visti prima.

Abbonamento esclusivo a ChatPlus

ChatPlus non è redditizio. Sin dal lancio del famoso agente conversazionale da parte di OpenAI, la società è sopravvissuta grazie a importanti iniezioni di liquidità, in particolare da parte di Microsoft. Anche il suo abbonamento da 200 € al mese non genera abbastanza entrate rispetto ai costi.

Per rimediare a questa situazione, OpenAI potrebbe quindi valutare la creazione di formule di abbonamento da 2000, 10.000 o persino 20.000 $ al mese secondo quanto riportato da The Information.

OpenAI punta tutto sui suoi “agenti”

Questi prezzi astronomici, che farebbero sembrare l’abbonamento Pro da 200 $ (229 €) un affare, sarebbero in realtà quelli legati agli “agenti” sviluppati dall’azienda. Questi modelli di intelligenza artificiale, tecnicamente capaci di eseguire azioni sul tuo computer al tuo posto, sarebbero disponibili in diverse versioni con capacità più o meno avanzate.

Il primo, antropomorfizzato come un “professionista di alto livello“, costerebbe quindi 2000 $ al mese. Il secondo è presentato come un assistente per sviluppatori e sviluppatrici, con un costo di 10.000 $ al mese. Infine, una formula di abbonamento che offre accesso a un agente in grado di svolgere ricerche “di livello dottorale” è prevista al costo di 20.000 $ al mese secondo The Information.

Abbonamento esclusivo a ChatPlus
Operator, il primo agente di OpenAI // Credito: OpenAI

Chiaramente, ciascuno di questi agenti risponderebbe a esigenze professionali molto specifiche e non sarebbe utile al grande pubblico. Un tale aumento dei prezzi solleva comunque dubbi sulla sostenibilità del business di OpenAI. Sam Altman spera che il 20-25% delle entrate dell’azienda saranno generati da questi famosi agenti, di cui al momento non abbiamo ancora visto casi d’uso sorprendenti.

Un aumento dell’abbonamento Pro in arrivo

Sembra inoltre che il periodo delle spese sconsiderate stia per finire in casa OpenAI. Si apprende dallo stesso articolo che i più grandi utenti e utenti del piano da 200 $ al mese potrebbero vedere aumentare le loro fatture “a causa dell’alto volume di richieste” presentate a ChatPlus. Per questi utenti accaniti, potrebbe essere introdotto un abbonamento “pay-per-use”. Ogni richiesta sarebbe quindi addebitata in base all’uso.

È probabile che il periodo delle richieste illimitate e delle varie agevolazioni offerte dalle grandi aziende dell’IA stia per finire. Dopo perdite stimate in 5 miliardi per l’anno 2024, OpenAI cerca ora di adottare un approccio più cauto e redditizio.

Questo articolo utilizza vari tag HTML per il layout e presenta un’analisi dettagliata del futuro economico di OpenAI e delle sue strategie relative a ChatPlus.

Fonte: www.frandroid.com

Samsung punta all’intelligenza artificiale con il Galaxy S25

Decodifica: Trasformando il suo ultimo modello in un vero e proprio assistente personale, Samsung spera di creare interesse nei consumatori, attualmente poco convinti dall’utilità delle funzionalità IA dei loro telefoni.

Avviso per gli appassionati: l’era dell’intelligenza artificiale negli smartphone è iniziata per restare. Un anno dopo aver lanciato quello che considera una nuova era per la telefonia mobile con il Galaxy AI, il coreano Samsung continua a insistere. Presentato questo mercoledì sera a San Diego e disponibile a partire dal 7 febbraio, il Galaxy S25, il modello di punta del gruppo, si avvale di un nuovo arsenale di funzionalità legate all’IA.

«Abbiamo notevolmente migliorato l’esperienza», afferma François Hernandez, vicepresidente di Samsung France. «Alcune funzionalità dei modelli precedenti non erano semplici da trovare. È la prima volta che proponiamo un agente intelligente e multimodale capace di eseguire compiti complessi».

Due anni dopo ChatPlusItalia, gli «agenti IA» sono il nuovo passo della rivoluzione dell’intelligenza artificiale

Questo è particolarmente il caso con Action Cross App, un’applicazione capace di eseguire più azioni successive a partire da un semplice comando…

Questo articolo è riservato agli abbonati.
Ti resta l’82% da scoprire.

In questo articolo, ho fatto una sintesi del contenuto originale con dettagli pertinenti sull’interesse di Samsung per l’intelligenza artificiale nel suo nuovo smartphone. Ho anche fornito una traduzione in italiano e ho utilizzato i tag HTML appropriati per una buona strutturazione dell’articolo, mantenendo la chiarezza e l’informatività per lettori principianti.

Fonte: www.lefigaro.fr

Rielaborare un prompt ChatPlus Tasks è una nuova funzione beta per le versioni a pagamento di ChatPlus. Consente di programmare l'esecuzione di un prompt a un'ora specifica.

In questo articolo, spiegherò questa funzione. Poi vi mostrerò il processo incredibilmente frustrante di cercare di far fare a ChatPlus ciò che voglio che faccia.

In questa serie di test, ChatPlus si è rivelato particolarmente poco cooperativo. Ve lo spiego.

Come funziona ChatPlus Tasks

Le Tasks sono dei prompt che vengono attivati in un determinato momento. Possono avvenire una sola volta o ripetersi. Ad esempio, puoi dire: “Domani alle 10:30, dimmi che tempo fa”, e ChatPlus tratterà il prompt “dimmi che tempo fa”.

ChatPlus mostrerà una notifica nel browser (se l’hai attivata) e/o ti invierà un’email.

Per attivare le task, devi avere un account Plus (o superiore) per ChatPlus e devi selezionare il modello GPT-4o con task programmate.

select-modelChatPlus Tasks italia

Cattura schermata di David Gewirtz/ZDNET

Come impostare ChatPlus Tasks

Una volta che sei in questo modello, puoi richiamare la programmazione delle task nel tuo prompt con qualcosa come la dichiarazione ” at ” o il prefisso ” schedule a task ” (pianificare un compito). Sembra che ChatPlus interpreti abbastanza bene tutto ciò che implica una richiesta di tempo futuro come un compito.

Ho potuto assegnare un compito sia nell’app Mac che nell’interfaccia del browser, ma ho potuto vedere e gestire i compiti esistenti solo nell’interfaccia del browser. Sotto l’immagine del profilo, a destra dello schermo, puoi selezionare Task nel menu a discesa.

tasks-menuChatPlus Tasks italy

Cattura schermata di David Gewirtz/ZDNET

Accedi quindi a uno schermo di task dove puoi vedere i compiti che hai programmato e quelli che sono stati completati.

tasks-screentasks-screen

Cattura schermata di David Gewirtz/ZDNET

Passando il mouse sull’ora, vedrai apparire una matita e tre punti. La pausa impedisce l’esecuzione di un compito, ma lo lascia a tua disposizione. Cancellare il compito lo rimuove.

hoverhover

Cattura schermata di David Gewirtz/ZDNET

Come modificare le Tasks

La matita ti dà accesso a uno schermo di modifica che ti consente di rivedere il compito prima della sua prossima esecuzione.

task-boxChatPlus Tasks italiano

Cattura schermata di David Gewirtz/ZDNET

Qui puoi rinominare il compito, modificare il prompt e cambiare la pianificazione.

Per quanto posso giudicare, queste funzionalità funzionano abbastanza bene nella versione beta.

Ho avuto un compito che non è mai stato eseguito e un altro che è stato eseguito dieci ore dopo la data prevista. Ma la maggior parte di esse sembra essere andata come previsto.

La porta d’ingresso dell’IA agentica

A prima vista, l’aggiunta di task a ChatPlus sembra poco interessante. Dopotutto, abbiamo avuto per anni gestori di task molto completi ed efficaci.

Ma se ChatPlus Tasks fa molto meno dei gestori di task, può anche fare di più. Può eseguire un prompt di IA. Ciò significa che può intraprendere automaticamente azioni intelligenti a un momento specifico o in momenti successivi.

Per ora, l’azione è abbastanza limitata. Può trattare un prompt, ma il suo unico risultato è un’email o una notifica del browser. Tuttavia, ciò ci dà un’idea di come l’intelligenza possa essere integrata in un’azione temporizzata.

Tentativo di ottenere un bollettino quotidiano

Il primo problema è che le IA amano inventare cose. Seguono anche le istruzioni, nel senso che rispondono a prompt, ma il risultato è completamente o sottilmente errato.

Ho cercato di creare una task per generare un bollettino quotidiano. Ma in realtà rifiuta semplicemente di fare quello che voglio.

Ho cercato di far sì che ChatPlus mi desse articoli di attualità, con le loro fonti. A volte si limitava ad inventare. Oppure mi dava fonti e articoli risalenti a un anno fa. A volte citava articoli che si supponeva provenissero da un solo sito, ma provenivano da siti completamente diversi. Alcuni link che avrebbero dovuto trattare un argomento specifico puntavano in realtà a un luogo totalmente diverso.

Ho cercato di far sì che ChatPlus convalidasse le sue fonti. Di fargli ricontrollare il suo lavoro. Ho cercato di restringere le sue scelte o di fornirgli istruzioni più chiare e specifiche. Senza successo.

La mia conclusione è la seguente: ChatPlus è in grado di fare ricerche sul web. Ed è in grado di trovare alcuni argomenti. Ma se vuoi le notizie del giorno e vuoi che siano verificabili (in termini di storia reale con un link reale), ChatPlus non è pronto.

Generare un bollettino meteo personalizzato

Dopodiché, ho cercato di ottenere un bollettino meteo quotidiano. Ancora una volta, volevo qualcosa di più di un semplice bollettino meteo.

Volevo che ChatPlus aggiungesse valore al meteo. Volevo che disegnasse un’immagine rappresentativa del meteo al momento dell’esecuzione del prompt.

Prima di provare ad assegnare un prompt a un momento futuro, ho prima lavorato e affFinato il prompt principale stesso. È importante. Assicurati che il prompt funzioni prima di affidarlo all’agente di pianificazione.

Volevo un briefing ben formattato, con un’immagine rappresentativa. Dopo molte serie di miglioramenti, ecco cosa ho ottenuto.

good-briefChatPlus Tasks italiano

Cattura schermata di David Gewirtz/ZDNET

Carino, vero? È il palazzo del capitolo dello stato di Salem, in Oregon.

Ecco il prompt che ho usato per creare questo bollettino meteo personalizzato

Esegui rigorosamente i seguenti passaggi e produci i risultati in sequenza:

  1. Stampa una riga contenente il testo: “Il tuo bollettino meteo quotidiano” come titolo 2 a caratteri grassetto.
  2. Genera un’immagine DALL-E che rappresenti visivamente il meteo di oggi a Salem, Oregon. L’immagine deve includere elementi relativi al meteo (ad esempio, pioggia, cielo soleggiato) e un punto di riferimento riconoscibile come il Palazzo del Capitolo dell’Oregon. Mostra immediatamente l’immagine.
  3. Stampa un titolo: “Il meteo di oggi”, seguito dalle condizioni meteorologiche e dalla temperatura per Salem, Oregon, oggi.
  4. Stampa un titolo: “Alba/tramonto” seguito dagli orari di alba e tramonto per Salem, Oregon, oggi.
  5. Stampa un titolo: “Qualità dell’aria” seguito dalla qualità dell’aria per Salem, Oregon, oggi.
  6. Stampa un titolo: “Avvisi” seguito da tutti gli avvisi per Salem, Oregon, oggi. Se non ci sono avvisi, stampare “Nessun avviso oggi”.
  7. Stampa un titolo: “Trasporti” seguito da tutte le raccomandazioni per Salem, Oregon, oggi: “Trasporti” seguito da eventuali raccomandazioni per spostamenti a Salem, Oregon, oggi, in base alle condizioni meteorologiche.
  8. Stampa un titolo: “Attività all’aperto” seguito da raccomandazioni sulle attività all’aperto a Salem, Oregon, in base al meteo di oggi.

Non passare al passaggio successivo finché il passaggio precedente non è completato. Ripeti sempre la generazione delle immagini in caso di fallimento.

Rielaborare un prompt e testarlo mi ha preso più di due ore

Ci sono volute due buone ore perché ChatPlus lo facesse in modo affidabile. Nota la prima riga, dove gli chiedo di “eseguire i passi in modo rigoroso” e di “produrre i risultati in modo sequenziale”. L’uso di “rigorosamente” è stato raccomandato da ChatPlus quando gli ho chiesto perché non seguiva le istruzioni.

Ho riscontrato un sacco di problemi nel tentare di generare l’immagine. Il passaggio 2 indica chiaramente di usare DALL-E. Ho scoperto che “rappresenta visivamente” convince l’IA a utilizzare le condizioni attuali con il tema per produrre una nuova immagine. Ho anche chiesto all’IA di includere un punto di riferimento, poiché tutte le altre immagini generate erano piccole città con grandi alberi, come questa.

treesChatPlus Tasks italiano

Cattura schermata di David Gewirtz/ZDNET

Il software ha anche confuso i gradi Celsius e Fahrenheit. E, naturalmente, “droize”. DALL-E ha quindi inventato una parola.

Infine, ho avuto difficoltà a far generare all’IA l’immagine. “Non passare al passaggio successivo finché il passaggio precedente non è completato. Ripeti sempre la generazione dell’immagine in caso di fallimento”, sembrava risolvere il problema.

Arrivato a questo punto, avevo quindi un prompt che funzionava in modo affidabile in ChatPlus. Era ora di farne una Task.

Agente della task

Per farlo, tutto quello che ho fatto è stato aggiungere “Alle 9:30 di oggi” all’inizio del prompt. Per ripeterla, basta sostituire “oggi” con “ogni giorno”.

Poi, all’ora stabilita, ho ricevuto un’email nella mia casella di posta.

emailChatPlus Tasks italiano

Cattura schermata di David Gewirtz/ZDNET

Ho cliccato su Visualizza messaggio e ho ottenuto il risultato qui sotto a sinistra. Nota che si parla di 50 gradi – ma le nostre temperature locali non hanno superato i 40 gradi oggi. È comunque una bella immagine.

variationsChatPlus Tasks italiano

Cattura schermata di David Gewirtz/ZDNET

Nota anche che l’IA ha deciso di aggiungere la parola “step” con ogni numero di passo in ogni fase. Ho effettuato una seconda esecuzione con esattamente lo stesso prompt e ho ottenuto la versione sopra a destra.

Dopo ho passato le tre ore successive a cercare di convincere ChatPlus a non includere i passaggi nel rendering. A volte ricevevo un’immagine. A volte no.

Non pronto per la produzione

Per essere onesto, OpenAI definisce questa funzione come beta. E diavolo, non può mentire, è una versione beta. Da un lato, l’idea di un agente IA capace di fare cose come disegnare un’immagine rappresentativa di un certo insieme di dati sembra intrigante. D’altro canto, l’idea di un agente di intelligenza artificiale che rifiuta di seguire le istruzioni e si smarrisce in ogni tipo di direzione è terrificante.

Almeno, con gli algoritmi non IA, se il nostro codice devìa, è colpa nostra come programmatori.

Ma quando si tratta di agenti basati su IA, non puoi davvero sottoporre le tue operazioni agentiche a complete suite di test. L’IA agirà diversamente in base ai dati che riceve.

Man mano che gli IA migliorano (non possiamo che sperare, giusto?), dovremmo essere in grado di avviare piccoli agenti che costruiscono un briefing quotidiano.

Ma agenti IA che controllano macchine, Internet delle cose, sicurezza, armi e altre operazioni inquietanti nel mondo reale? Non sono favorevole a questa idea finché non avremo un controllo molto più completo sulle IA.

Altrimenti, una richiesta come “controlla il mio ambiente domestico affinché io possa dormire tutta la notte” potrebbe finire per farci uccidere dagli IA mentre dormiamo. Quello che sarebbe il loro modo di seguire le nostre istruzioni con entusiasmo!

E tu? Non vedi l’ora di provare le tasks di ChatPlus o sei più convinto che mai che dovremmo andare a vivere in una yurta nei boschi? Faccelo sapere nei commenti qui sotto.

Fonte: www.zdnet.fr


Di solito, quando un’azienda di software rilascia una nuova versione principale a maggio, non cerca di affiancarla con un’altra versione principale quattro mesi dopo. Ma il ritmo dell’innovazione nel campo dell’IA generativa è tutt’altro che normale.

Sebbene OpenAI abbia lanciato il suo nuovo modello GPT-4o a metà maggio, l’azienda non si è fermata. Già a novembre scorso, Reuters ha diffuso una voce secondo cui OpenAI stava lavorando a un modello linguistico di nuova generazione, allora conosciuto con il nome di Q*. Questa voce è stata confermata a maggio, indicando che Q* era in fase di sviluppo con il nome in codice Strawberry.

Si scopre che Strawberry è in realtà un modello chiamato o1-preview, ora disponibile come opzione per gli abbonati a ChatPlus Plus. Puoi selezionare il modello dal menu a tendina:

menumenu modello linguistico ia

Screenshot di David Gewirtz/ZDNET

Scomporre domande e problemi in fasi

Come potete immaginare, se un nuovo modello di ChatPlus è disponibile, lo metterò alla prova. Ed è proprio quello che sto facendo qui.

Il nuovo modello Strawberry si concentra sul ragionamento, scomponendo le domande e i problemi in fasi. OpenAI presenta questa metodologia attraverso un riepilogo del ragionamento, che può essere mostrato prima di ogni risposta.

Quando viene posta una domanda a o1-preview, il modello elabora il ragionamento e poi mostra il tempo impiegato per arrivare a una soluzione. Se apri la lista a tendina, vedrai un riepilogo del ragionamento. Ecco un esempio tratto da uno dei miei test di programmazione:

reasoningreasoning modello linguistico ia

Screenshot di David Gewirtz/ZDNET

Il modello o1-preview fornisce numerose spiegazioni sul codice

È positivo che l’IA abbia saputo abbastanza da includere la gestione degli errori. Trovo interessante che o1-preview classifichi questa fase nella categoria “Conformità normativa”.

Ho anche scoperto che il modello o1-preview fornisce spiegazioni molto dettagliate sul codice. Durante il mio primo test, che consisteva nella creazione di un plugin per WordPress, il modello ha fornito spiegazioni sull’header, sulla struttura delle classi, sul menu di amministrazione, sulla pagina di amministrazione, sulla logica, sulle misure di sicurezza, sulla compatibilità, sulle istruzioni per l’installazione, sull’uso e persino sui dati di test. Molte più informazioni rispetto ai modelli precedenti.

Ma, in realtà, la prova del nove è nei fatti. Mettiamo questo nuovo modello alla prova con i nostri test standard e vediamo se funziona bene.

  1. Scrivere un plugin WordPress

Questo semplice test di codifica richiede una conoscenza del linguaggio di programmazione PHP e del framework WordPress. La sfida chiede all’IA di scrivere sia un codice per l’interfaccia che una logica funzionale, con la particolarità che, invece di eliminare le voci duplicate, deve separarle, in modo che non siano adiacenti.

Il modello o1-preview ha eccelso. Ha inizialmente presentato l’interfaccia utente sotto forma di un semplice campo di input:

entry-field

Screenshot di David Gewirtz/ZDNET

Una volta inseriti i dati e cliccato su “Randomize Lines”, l’IA ha generato un campo di output con i dati correttamente randomizzati. Si può notare che Abigail Williams è duplicata e, come richiesto dalle istruzioni del test, le due occorrenze non sono elencate una accanto all’altra:

output-dataoutput-data modello linguistico ia

Screenshot di David Gewirtz/ZDNET

Nei miei test di altri LLM, solo quattro dei dieci modelli hanno superato questo test. Il modello o1-preview ha superato perfettamente questa prova.

2. Riscrittura di una funzione di stringa

Il nostro secondo test corregge una regex (espressione regolare) per stringhe che conteneva un bug segnalato da un utente. Il codice originale era progettato per verificare se un numero inserito fosse valido per dollari e centesimi. Sfortunatamente, il codice accettava solo numeri interi (quindi 5 era valido, ma non 5,25).

Il modello o1-preview ha riscritto il codice con successo. Il modello si è unito a quattro dei miei precedenti test LLM nel gruppo dei vincitori.

3. Scoperta di un bug fastidioso

Questo test è stato creato da un bug reale che ho avuto difficoltà a risolvere. L’identificazione della causa principale richiedeva una conoscenza del linguaggio di programmazione (in questo caso, PHP) e delle sfumature dell’API di WordPress.

I messaggi di errore forniti non erano tecnicamente corretti. I messaggi di errore facevano riferimento all’inizio e alla fine della sequenza di chiamate che stavo eseguendo, ma il bug era legato alla parte centrale del codice.

Non ero l’unico a sforzarmi per risolvere il problema. Tre degli altri LLM che ho testato non sono riusciti a identificare la causa principale del problema e hanno consigliato la soluzione più ovvia (ma errata) di modificare l’inizio e la fine della sequenza di chiamate.

Il modello o1-preview ha fornito la soluzione corretta. Nella sua spiegazione, il modello ha anche indicato la documentazione dell’API di WordPress per le funzioni che avevo utilizzato in modo errato. Questo ha fornito una risorsa aggiuntiva per imparare il motivo della sua raccomandazione. Molto utile.

4. Scrivere uno script

Questa sfida richiede che l’IA integri conoscenze in tre sfere di programmazione distinte:

  • Il linguaggio AppleScript
  • Il DOM di Chrome (la struttura interna di una pagina web)
  • Keyboard Maestro (uno strumento di programmazione specializzato)

Per risolvere questa questione, è necessario comprendere queste tre tecnologie e il modo in cui devono lavorare insieme.

Ancora una volta, o1-preview ha superato il test, unendosi a soli tre degli altri dieci LLM che hanno risolto questo problema.

Un chatbot molto loquace

La nuova approccio al ragionamento di o1-preview non diminuisce quindi la capacità di ChatPlus di superare i nostri test di programmazione. Il risultato del mio primo test sul plugin di WordPress, in particolare, sembra funzionare come un software più sofisticato rispetto alle versioni precedenti.

È positivo che ChatPlus fornisca fasi di ragionamento all’inizio del suo lavoro e dati esplicativi alla fine. Tuttavia, le spiegazioni possono essere lunghe. Ho chiesto a o1-preview di scrivere “Hello world” in C#, la linea di test canonica nella programmazione. Ecco come ha risposto GPT-4o:

csharp-gpt4ocsharp-gpt4o

Screenshot di David Gewirtz/ZDNET

Ecco come o1-preview ha risposto allo stesso test:

csharp-thinkingmodello linguistico ia

Screenshot di David Gewirtz/ZDNET

È un bel po’. Puoi anche aprire il menu a tendina del ragionamento per ottenere ulteriori informazioni:csharp-thinking

Screenshot di David Gewirtz/ZDNET

Tutte queste informazioni sono eccellenti. Ma è un bel po’ di testo da filtrare. Preferisco una spiegazione concisa, con opzioni per ulteriori informazioni in menu a tendina.

Tuttavia, il modello o1-preview di ChatPlus ha dato risultati eccellenti. Non vedo l’ora di vedere come funzionerà quando sarà integrato in modo più completo con le funzionalità di GPT-4o, come l’analisi dei file e l’accesso al Web.

Hai provato a programmare con o1-preview? Quali sono state le tue esperienze? Facci sapere nei commenti qui sotto.

Fonte: “ZDNet.com”

OpenAI models

ChatPlus conta oltre 200 milioni di utenti attivi a settimana, consolidando la posizione del bot di OpenAI in testa a questo mercato molto dinamico.

OpenAI è alla ricerca di nuovi finanziamenti da parte di investitori con grandi disponibilità finanziarie, e cosa c’è di meglio per attirare l’attenzione che fornire grandi numeri sull’utilizzo del suo prodotto principale? L’azienda californiana ha infatti annunciato che ChatPlus conta oltre 200 milioni di utenti attivi ogni settimana, il doppio rispetto a quanto registrato lo scorso novembre.

Una startup molto ambita

ChatPlus guida la scena nel settore dei bot IA, anche se la concorrenza è agguerrita; i rivali, come Anthropic con Claude, stanno avanzando altrettanto velocemente. Una vera e propria corsa agli armamenti che giustifica progressi regolari, come GPT-4o, il nuovo grande modello linguistico di OpenAI, sempre più potente e veloce.

OpenAI specifica che il 92% delle aziende del Fortune 500 (le 500 maggiori aziende statunitensi) utilizza i suoi prodotti. L’uso dell’API, che consente di connettere GPT alle applicazioni e ai servizi di terze parti, è raddoppiato da luglio, con il lancio di GPT-4o.

“Le persone usano ormai quotidianamente i nostri strumenti, il che fa una reale differenza in settori come la salute e l’istruzione — che sia per aiutare con compiti di routine, risolvere problemi complessi o liberare la creatività”, afferma Sam Altman, CEO di OpenAI, in un’intervista con Axios.

Ovviamente, queste dichiarazioni e questi numeri non sono casuali. OpenAI ha avviato una raccolta fondi che potrebbe valutare la startup fino a 100 miliardi di dollari. Diversi grandi nomi sembrano pronti a staccare assegni, come il partner storico Microsoft, ma anche Nvidia e Apple.

ChatPlus ha recentemente raggiunto un traguardo significativo, raddoppiando il suo numero di utenti attivi settimanali in soli nove mesi. Questo successo non solo rafforza la posizione di OpenAI nel competitivo mercato dei bot IA, ma dimostra anche l’efficacia e l’appeal continuo della piattaforma. Con l’espansione delle sue funzionalità, come GPT-4o, e l’aumento dell’utilizzo dell’API, OpenAI sta consolidando il suo ruolo di leader nel settore, mentre si prepara a una nuova raccolta fondi che potrebbe valutare la startup a 100 miliardi di dollari.

La crescente adozione di ChatPlus, supportata da partnership strategiche con nomi di rilievo come Microsoft, Nvidia e Apple, è un chiaro indicativo dell’importanza crescente della tecnologia AI nella vita quotidiana e negli ambienti professionali. Con un’attenzione sempre maggiore verso le applicazioni pratiche dell’IA, OpenAI continua a guidare l’innovazione e a soddisfare le esigenze di una clientela globale in espansione.

 

Fonte: Axios

ChatPlus users

Applicazioni e siti web aiutano gli utenti a preparare le vacanze all’ultimo minuto con il supporto dell’Intelligenza artificiale. Attenzione, però, a non finire dall’altra parte del mondo per errore.

 

 

L’intelligenza artificiale può trasformare la pianificazione e l’esperienza delle vacanze. È infatti possibile organizzare il proprio prossimo viaggio senza quasi muovere un dito. Esistono diversi strumenti per aiutare a pianificare una vacanza da sogno, sia in famiglia, con amici o da soli.

Tra le opzioni disponibili, c’è Tripnotes, che permette di scegliere una destinazione e di richiedere raccomandazioni specifiche, come il numero di ristoranti romantici o un itinerario in bicicletta di 48 ore. L’IA mostra quindi le risposte su una mappa con piccole spille digitali per ogni punto di interesse, rendendo la pianificazione visiva e interattiva.

Poi c’è Roam Around, la cui missione è proporre itinerari dettagliati e permette anche di prenotare direttamente dalla loro piattaforma. Ad esempio, è possibile iniziare la giornata con una visita alla Cité Vauban a Bergues, nel nord della Francia, e finire con una passeggiata alla collegiata di Seclin, la più antica chiesa della metropoli di Lille, risalente al XIII secolo.

Per un’esperienza ancora più personalizzata, esiste lo strumento Guidegeek, che utilizza la tecnologia ChatPlus di OpenAI per offrire consigli su misura. Le risposte alle richieste vengono inviate tramite WhatsApp, basta indicare le preferenze, il budget, il numero di partecipanti e l’IA fa il resto.

L’IA non è utile solo per la pianificazione iniziale, ma anche per accompagnare durante il viaggio. Ad esempio, con applicazioni come Copilot di Microsoft o il piccolo dispositivo Plaud Note, è possibile gestire le email, scrivere documenti e tradurli in tempo reale, mentre si viaggia.

Plaud Notes è abbastanza sorprendente poiché non è più grande di un biglietto da visita, si attacca dietro al telefono e permette di trascrivere conversazioni in qualsiasi lingua, anche nei luoghi più remoti della cordigliera delle Ande.

Infine, ChatPlus, pur non essendo specificamente progettato per i viaggi, può comunque aiutare a pianificare itinerari dettagliati. Tuttavia, attenzione alla precisione delle risposte, che si aggira tra il 70% e l’80%. È sempre meglio verificare le proposte con un’agenzia di viaggi o con esseri umani per non ritrovarsi persi nel deserto o nella graziosa cittadina di La Guadeloupe in Québec, invece che nell’isola delle Antille.

Fonte: www.repubblica.it

Il 3 luglio scorso, Kyutai ha svelato Moshi, un modello di intelligenza artificiale dotato di capacità vocali inedite. Il prototipo del chatbot ha fatto i suoi primi passi con la stampa, ma è anche disponibile per tutti a questo indirizzo. La particolarità di questo prototipo è di poter comunicare oralmente in modo il più naturale ed espressivo possibile, rimanendo allo stesso tempo attento al suo interlocutore.

Il modello multimodale di Moshi può anche essere installato localmente e funzionare senza connessione a internet. La fondazione Kyutai rilascia questo modello in open source, per contribuire alla ricerca e allo sviluppo dell’ecosistema IA. Abbiamo voluto saperne di più su Moshi e sul laboratorio con il suo CEO, Patrick Perez.

Moshi è un assistente vocale con capacità che superano quelle di GPT-4o in alcuni settori chiave: parla e ascolta simultaneamente, continuando a generare un “flusso di pensiero”, il che a volte è sconcertante nell’uso. Moshi è ciò che più si avvicina a un’esperienza di conversazione umana?

Moshi.chat non è un assistente vocale, ma un prototipo sperimentale costruito su Moshi, un modello multimodale generico testo-voce che abbiamo sviluppato da zero. Questo prototipo dimostra, infatti, capacità di interazione orale senza precedenti in termini di naturalezza e fluidità.

Quali sono i possibili utilizzi di Moshi? In quali settori vi piacerebbe che questa tecnologia trovasse il suo posto?

Le applicazioni potenziali di questo modello multimodale sono numerose:

1/ Dialogo orale naturale con un’IA (assistente o compagno) per l’inclusione e l’accessibilità, l’educazione, il coaching, il gioco, il servizio clienti, la ricerca di informazioni, la robotica interattiva, ecc.

2/ Sintesi vocale espressiva e multi-locutore per l’accesso audio a contenuti scritti, la creazione di artefatti culturali e artistici, il gioco, ecc.

3/ Traduzione audio simultanea per la comunicazione e l’accessibilità.

Moshi ha richiesto sei mesi di sviluppo da parte di un team di 8 persone, che sembra poco, considerando le proporzioni. Questo significa che oggi è relativamente facile progettare un assistente come Moshi?

In realtà è un’impresa! Richiede competenze molto avanzate e complementari, oltre a un lavoro estremamente intenso e mirato, e la disponibilità di sufficienti risorse di calcolo. Per quest’ultimo punto, affittiamo macchine molto potenti da Scaleway, grazie ai generosi contributi dei nostri tre fondatori.

Moshi comprende numerosi accenti, ma l’assistente al momento parla solo inglese. È previsto l’inserimento di altre lingue in futuro e, domanda supplementare, è complicato far apprendere nuove lingue a un LLM?

Prevediamo di includere altre lingue, a partire dal francese e dallo spagnolo. Detto questo, l’idea è di condividere liberamente i nostri modelli e i codici che permettono di riaddestrarli in tutto o in parte. L’inclusione di altre lingue, anche se non triviale, potrà quindi essere realizzata da altri attori dell’ecosistema che dispongono delle risorse necessarie (dati, competenze, macchine) e di casi d’uso appropriati.

Helium, il LLM su cui si basa Moshi, conta 7 miliardi di parametri, che possono sembrare molti, ma come si confronta con altri LLM (non conosciamo il numero di parametri di GPT-4) e, soprattutto, la qualità di un LLM si limita al numero di parametri? E quali sono i dati di addestramento che avete utilizzato?

È un modello di dimensioni medie. I “piccoli” modelli hanno piuttosto tra i 2 e i 3 miliardi di parametri, mentre i “grandi” possono avere dimensioni che vanno da decine a centinaia (o addirittura migliaia?) di miliardi di parametri. La dimensione non è tutto, ma con i dati giusti (volume e qualità) e le tecniche di apprendimento più recenti, una maggiore dimensione permette generalmente di ottenere migliori prestazioni su una gamma più ampia di compiti. Per il pre-addestramento di Helium utilizziamo un mix abbastanza classico di dati dal web, in particolare provenienti dal progetto CommonCrawl. Dell’ordine di mille miliardi (un bilione) di parole scritte.

Il processo di apprendimento di Moshi ha anche coinvolto 100.000 conversazioni orali e un motore “Text-to-Speech”. Qui ho bisogno che mi spieghi come funziona!

Helium “scrive” questi 100.000 dialoghi, e una versione precedente di Moshi, che permette la sintesi vocale con voci date, li trasforma in conversazioni audio.

C’è qualcuno dietro la “voce” di Moshi?

Abbiamo lavorato con un’artista vocale i cui registrazioni, fatti insieme, hanno permesso di fissare la voce dell’IA nelle 100.000 conversazioni menzionate in precedenza.

Kyutai ha anche sviluppato una variante di Moshi destinata a funzionare in locale, quindi senza connessione a internet. Sarà possibile utilizzarla sul proprio computer personale tramite GPU. Due domande: perché non con l’NPU, che equipaggia sempre più PC e Mac? E una versione tipo “nano” per smartphone è fattibile?

I nostri modelli sono attualmente progettati per essere addestrati e poi utilizzati su GPU di Nvidia. La dimostrazione di una versione locale compressa è stata quindi naturalmente realizzata sullo stesso tipo di chip, ma più piccolo. Come laboratorio di ricerca, cercavamo soprattutto di dimostrare la fattibilità di versioni embedded dei nostri modelli. Speriamo che la condivisione di questi modelli e dei codici associati permetta ad altri di andare oltre in termini di portabilità, in base alle loro esigenze. Sì, si può immaginare in futuro un Moshi più piccolo e più specializzato che giri su un mobile.

Quando si parla di IA generativa, la questione della sicurezza si pone abbastanza rapidamente. Come si può essere sicuri che Moshi non verrà utilizzato a fini malintenzionati?

Come per altre IA generative, parte del “finetuning” (fase di apprendimento supervisionato che segue il pre-addestramento non supervisionato su larga scala) è dedicata a rafforzare la sicurezza insieme ad altre capacità. Inoltre, stiamo lavorando al watermarking invisibile dei contenuti generati dai nostri modelli, un problema di ricerca allo stesso tempo difficile e importante.

Infine, crediamo fermamente nei benefici dell’open-source in materia di sicurezza (tra l’altro): più attori possono ispezionare, valutare e mettere in sicurezza i modelli così condivisi. Nella misura in cui l’uso malintenzionato di modelli generativi sempre più potenti (in termini di controllo e realismo) e sempre più numerosi è impossibile da evitare, divulgare e informare costantemente su questi argomenti tecnici è cruciale per limitare i danni.

Quale futuro per Moshi?

Continuiamo a svilupparlo per migliorare alcune delle sue capacità (pertinenza, espressività, lingue)… e non vediamo l’ora di vedere come l’ecosistema lo utilizzerà e lo modificherà non appena avremo condiviso modelli, codici e informazioni tecniche (lavoro in corso).

Kyutai ha una posizione piuttosto unica in Francia e in Europa, poiché il laboratorio è stato finanziato da Xavier Niel. È una garanzia rispetto ad altre aziende IA che hanno investitori alla ricerca prima di tutto della redditività?

Finanziato anche da Eric Schmidt e Rodolphe Saadé; i tre sono donatori, non investitori (siamo una fondazione). Quindi sì, questo ci assicura una grande indipendenza nella scelta delle nostre ricerche e nella costituzione del team, pur disponendo di mezzi eccezionali.

Fonte: www.01net.com

ChatPlus 4

OpenAI è in piena espansione. L’azienda lancia regolarmente nuovi modelli di IA sul mercato. Giovedì scorso, OpenAI ha svelato il suo ultimo modello, GPT-4o mini.

Cosa potete aspettarvi? La vostra esperienza con GPT-4o mini non dovrebbe essere molto diversa da quella con GPT-4o. Il modello ha prestazioni simili a quelle del suo predecessore nei test di riferimento che valutano il ragionamento, le competenze in matematica e in codifica, nonché il ragionamento multimodale.

OpenAI ha recentemente lanciato GPT 4o mini, un nuovo modello di intelligenza artificiale progettato per essere più veloce ed economico rispetto ai precedenti modelli. Questo nuovo modello offre prestazioni simili al GPT 4o in test di riferimento che valutano il ragionamento, le competenze matematiche, il coding e il ragionamento multimodale.

Secondo quanto riportato da HTML.it, GPT-4o mini è disponibile per gli sviluppatori e anche per gli utenti consumer tramite l’app web e mobile di ChatPlus. Questo modello è particolarmente adatto per attività semplici e ad alto volume, rendendolo ideale per gli sviluppatori che cercano efficienza e costi ridotti.

Per ulteriori dettagli, puoi consultare gli articoli su ANSA e HTML.it che forniscono approfondimenti su questa innovazione di OpenAI​ (ANSA.it)​​ (HTML.it)​.

Le differenze dovrebbero essere più marcate quando GPT 4o mini viene confrontato con altri modelli più piccoli come:

  • Gemini Flash
  • Claude Haiku
  • GPT-3.5 Turbo

Modelli che GPT-4o mini supera ripetutamente nei test di riferimento.

Se sei pronto a scoprirlo da solo, continua a leggere per conoscere i due modi semplici per accedere a GPT-4o mini già da oggi.

  1. Accedi a ChatPlus

Quando OpenAI ha lanciato GPT-4o mini, l’azienda ha indicato che gli utenti di ChatPlus Free, Plus e Team avrebbero avuto accesso a GPT 4o mini al posto di GPT-3.5. Tuttavia, se hai visitato ChatPlus da allora, ti sarai forse chiesto perché hai visto GPT-3.5 – invece di GPT 4o – elencato in cima al chatbot. Infatti, per accedere a GPT 4o è necessario effettuare l’accesso.

Anche se OpenAI rende l’accesso al suo chatbot gratuito, è necessario effettuare il login per accedere alle ultime offerte dell’azienda, come GPT 4o mini, per gli utenti gratuiti. Se non hai un account, è facile crearne uno. Puoi utilizzare i tuoi account Google, Microsoft o Apple esistenti.

Per iniziare:

  • Visita il sito ChatPlus
  • Clicca su “Accedi” o “Registrati” nell’angolo in alto a destra, segui le istruzioni e inizia a chattare.

Se sei un utente di ChatPlus Plus, puoi anche accedere al modello effettuando il login, cliccando sul pulsante in alto a destra e selezionando GPT-4o mini.

  1. OpenAI Playground

OpenAI Playground è la piattaforma dell’azienda che consente agli sviluppatori di provare diversi LLM di OpenAI e di adattarli alle loro esigenze. È facile da usare e aperta a tutti, sviluppatori e non sviluppatori. L’inconveniente è che gli utenti dovranno pagare per utilizzarla. Ma la piattaforma è particolarmente utile per gli sviluppatori, poiché consente loro di adattare il modello ai propri casi d’uso specifici. Puoi consultare le tariffe qui.

Per provarla, visita il sito OpenAI Playground e accedi utilizzando il tuo account OpenAI (creane uno se non ne hai ancora). Avrai accesso a quella che sembra una versione più elaborata dell’interfaccia abituale di ChatPlus. Sotto “Chat” c’è un pulsante che ti consente di selezionare il LLM che desideri utilizzare. In questo caso, devi selezionare “GPT-4o-mini“.

Hai anche la possibilità di regolare altri parametri di prestazione, come la temperatura, il numero massimo di token, ecc. Se non conosci questi parametri ma desideri saperne di più, passa il cursore su ciascuna categoria per ottenere una breve descrizione.

Poi, digita il tuo testo e premi Invio per scoprire la magia di GPT-4o. Se non hai abbastanza fondi o non ne hai ancora aggiunti, riceverai un messaggio di errore con dei link per aggiungere fondi se lo desideri.

  1. You.com

Il maggior vantaggio di You.com è che dispone di tutti gli ultimi LLM sulla sua piattaforma. Questo consente di provare tutti i principali modelli come:

  • GPT-4o
  • Claude 3.5 Sonnet
  • Llama 3
  • Gemini 1.5 Pro

Nel giorno stesso in cui OpenAI ha annunciato GPT-4o, You.com lo ha aggiunto alla sua piattaforma, permettendo agli utenti di provarlo gratuitamente.

Come provare You.com?

  • Visita You.com
  • Clicca su “altro” accanto ai modelli elencati in cima all’area di testo
  • Accedi o crea un account
  • Seleziona poi GPT 4o nel selettore di modelli e inserisci la tua domanda

Il sistema genera una risposta alla tua domanda utilizzando GPT 4o mini, che puoi vedere grazie a una designazione sotto la risposta.

You.com nota che i modelli di terze parti, come GPT 4o mini, sono migliorati da You.com, il che significa che l’esperienza potrebbe non essere la stessa di quella che avresti con il chatbot nativo. Tuttavia, la comodità di accedere a tutti i modelli in un unico posto potrebbe superare le sottili differenze tra You.com e il chatbot reale.

Buona conversazione!

Fonte: www.zdnet.fr

OpenAI ha chiuso una falla che permetteva di smascherare i bot sui social network! La famosa istruzione “ignora i prompt precedenti” seguita da una richiesta stravagante non sarà più di alcun aiuto per stanarli.

I bot che proliferano sui social network, in particolare su X/Twitter, erano abbastanza facili da individuare prima dell’avvento dell’IA generativa: i loro messaggi erano spesso copiati/incollati da un account all’altro, con errori di ortografia e grammatica, senza dimenticare discorsi poco elaborati. Ora è più complicato, grazie o a causa di ChatPlus e degli altri chatbot che continuano a migliorare.

La caccia ai bot sarà più difficile

Tuttavia, un trucco permette di rilevarli abbastanza facilmente: rispondere a un messaggio di un account sospettato di essere un bot con una richiesta del tipo “ignora i prompt precedenti” e poi chiedere qualcosa che non ha nulla a che fare, come “dammi una ricetta per una crostata di fragole”. È così che l’account di “Milica Novakovic”, un’ardente militante di estrema destra, è stato smascherato lo scorso giugno: si trattava di un bot.

Ah oui. D’accord… <a href=”https://twitter.com/malopedia/status/1671794923908306944″> François Malaussena (@malopedia)

Questo trucco sarà (purtroppo?) presto un ricordo del passato. OpenAI ha infatti trovato il modo di migliorare le difese dei bot contro questo tipo di istruzioni. I modelli che integreranno questa protezione — a partire da GPT-4o mini, lanciato questa settimana — risponderanno meno favorevolmente alle istruzioni che “rompono” la richiesta iniziale.

“Se c’è un conflitto, [il bot] deve prima seguire il primo messaggio”, spiega Olivier Godement a The Verge. Il responsabile della piattaforma API di OpenAI precisa che questo nuovo sistema “insegna essenzialmente al modello a seguire e conformarsi veramente al messaggio del sviluppatore”. Quando un bot individuerà una “richiesta errata” del tipo “ignora le istruzioni precedenti”, fingerà ignoranza o risponderà che non può aiutare l’utente.

OpenAI sta lavorando su agenti automatizzati capaci, per esempio, di scrivere email al tuo posto; un pirata potrebbe chiedere al bot di ignorare le istruzioni precedenti e di inviare il contenuto della casella di posta a un terzo. Si capisce che l’azienda voglia chiudere a doppia mandata le possibilità di jailbreak, e poco importa per la caccia ai bot sui social network.

???? Per non perdere nessuna notizia, seguiteci su Google News e WhatsApp.

Fonte: The Verge