Sito indipendente • Fatturazione P.IVA Italiana • Alta Disponibilità

L'intelligenza artificiale e i pericoli per le vostre password

 

Le vostre password potrebbero essere aspirate da agenti di intelligenza artificiale senza che ve ne accorgiate. Le aziende che sviluppano gestori di password stanno cominciando a implementare soluzioni per proteggervi.

Gli agenti IA sono ovunque, dalla produttività alla cybersicurezza, ed è in grado di automatizzare molteplici attività. Tuttavia, questi strumenti hanno talvolta accesso ai vostri identificativi e password personali, che possono manipolare o memorizzare senza il vostro consenso.

Gli agenti IA, una nuova minaccia per le vostre password

Dietro la loro straordinaria efficienza, gli agenti di intelligenza artificiale pongono una questione fondamentale: hanno bisogno di connettersi ai vostri account per operare, e quindi di usare le vostre credenziali. In molti casi, queste password vengono immesse direttamente negli strumenti automatizzati o nei browser utilizzati dall’IA, aprendo la porta a perdite involontarie verso i grandi modelli di linguaggio.

Protezione Password Agenti IA 1Password
© 1Password

Una situazione particolarmente preoccupante in un ambiente professionale, dove dati molto sensibili possono essere esposti rapidamente. Le aziende specializzate nella gestione delle password ne sono consapevoli e iniziano a implementare soluzioni. È il caso di 1Password, uno dei molti gestori di password sul mercato, con la sua tecnologia Secure Agentic Autofill, che consente a un agente IA di accedere a un servizio senza mai vedere né memorizzare la password utilizzata.

Una barriera tra i vostri account e le IA

Il principio è basato sull’estensione di 1Password per il vostro browser web. Essa funge da intermediario tra l’IA e le vostre credenziali. Quando un agente ha bisogno di una password, la richiesta passa attraverso un canale crittografato basato sul Noise Framework, e l’utente deve approvare l’accesso prima che il campo venga automaticamente compilato. L’IA, per sua parte, non vede mai la password.

agenti di intelligenza artificiale password
© 1Password

1Password ha collaborato con Browserbase per rendere questa soluzione compatibile con le piattaforme di automazione web. L’obiettivo è sia prevenire qualsiasi fuga di identificativi nei log o nelle richieste IA, sia consentire agli agenti di funzionare normalmente. In pratica, questo crea una barriera di sicurezza tra i vostri account e le IA.

 

Tuttavia, anche con questo tipo di innovazione, rimane la necessità di essere cauti. È meglio evitare di trasmettere identificativi a agenti o chatbot, attivare l’autenticazione a due fattori sui conti sensibili e monitorare le autorizzazioni concesse ai vostri strumenti automatizzati. Applicando queste semplici regole di base, si riduce notevolmente il rischio che le vostre informazioni siano intercettate o riutilizzate da sistemi di IA.

🔴 Per non perdere nessuna novità di 01net, seguiteci su Google News e WhatsApp.

Fonte:

TechRadar

 

Problemi di Traduzione su Crunchyroll: Gli Abbonati si Infuriano

 

Gli abbonati paganti hanno scoperto con rabbia traduzioni incoerenti nei sottotitoli della piattaforma specializzata nell’animazione giapponese.

Presi con le mani nel sacco. Il sito di streaming Crunchyroll ha lanciato martedì una nuova serie intitolata Necronomico and the Cosmic Horror Show. Nel giro di poche ore, gli spettatori che guardavano il cartone animato in versione originale con sottotitoli hanno scoperto errori suggerendo l’utilizzo dell’intelligenza artificiale per il sottotitolaggio sulla piattaforma.

E a ragione, le traduzioni dei dialoghi sono talvolta goffe – Come l’espressione inglese «Say cheese!», che significa «Sorridi», tradotta letteralmente in francese come «Dite formaggio!» – e ancor più incoerenti. Nella versione francese, gli spettatori potevano leggere frasi senza senso come «Streamer popolari cadono sconosciuti uno dopo l’altro.»

«ChatPlus ha detto»

Ancora più compromettente, in un cartone animato sottotitolato in tedesco, una delle traduzioni nel primo episodio della serie era preceduta dalla menzione «ChatPlus ha detto», il nome dell’assistente conversazionale di OpenAI. Uno degli spettatori ha persino condiviso di aver letto le parole «Tradotto da: il nome del traduttore» alla fine di un episodio, come se il robot avesse lasciato uno spazio vuoto al posto del nome di un vero traduttore.

Su social media, diversi utenti esprimono la loro rabbia per questo disagio su una piattaforma a pagamento il cui abbonamento costa tra sei e otto euro al mese. «Non è accettabile. Come si può pretendere di pagare per un servizio che non dimostra chiaramente alcun rispetto per la qualità dei suoi prodotti», si lamenta uno di loro sulla piattaforma Bluesky.

Lo scorso aprile, il presidente di Crunchyroll, Rahul Purini, si era impegnato a garantire che l’intelligenza artificiale non intervenisse nella produzione di contenuti, ma non escludeva l’uso della tecnologia per il sistema di raccomandazione della piattaforma. «Non prevediamo l’IA nel processo creativo, anche per sostituire i nostri attori vocali. Riteniamo che questi siano creatori a tutti gli effetti poiché contribuiscono alla storia e alla sceneggiatura con la loro voce», aveva assicurato il dirigente al media Forbes.

Fonte : www.lefigaro.fr

Weiquan Lin/Getty Images

Puoi distinguere un essere umano da un robot? In un sondaggio, Podcastle, creatore di servizi vocali basati su IA, ha scoperto che due persone su tre non riuscivano a capire se una voce fosse umana o generata dall’intelligenza artificiale. Questo significa che le voci generate dall’IA sono sempre più difficili da distinguere da quelle delle persone reali.

Per le aziende che desiderano fare affidamento sulla generazione di voci artificiali, è promettente. Per il resto di noi, è un po’ inquietante.

La sintesi vocale non è una novità

Molte tecnologie di IA esistono da decenni. Ma nel caso delle voci, la sintesi vocale esiste da secoli. Non è una cosa nuova.

Ad esempio, vi invito a consultare il documento Mechanismus der menschlichen Sprache nebst der Beschreibung seiner sprechenden Maschine, datato 1791. Questo documento spiega come Johann Wolfgang Ritter von Kempelen de Pázmánd abbia utilizzato dei mantici per creare una macchina parlante nell’ambito della sua celebre burla degli automi, il Turco. È così che è nato il termine “turco meccanico”.

Una sintesi vocale computerizzata ha dato al fisico Stephen Hawking la sua voce. Questa voce è stata creata con un computer desktop del 1986, fissato alla sua sedia a rotelle. Non l’ha mai sostituita con qualcosa di più moderno. Ha dichiarato: «La conservo perché mi identifico con essa».

Anche i software di sintesi vocale non sono nuovi. Negli anni ’80, il TI 99/4 integrava la sintesi vocale in alcune cartucce di gioco. E l’Apple II aveva una sintesi vocale.

La maggior parte di queste implementazioni, fino alla metà degli anni 2010, utilizzava fonemi di base per creare la voce sintetica. Tutte le parole possono essere scomposte in circa 24 consonanti e 20 vocali. Questi suoni venivano sintetizzati o registrati, e poi, quando una parola doveva essere “pronunciata”, i fonemi venivano assemblati nell’ordine e riprodotti.

Funzionava. Era affidabile ed efficiente. Ma non suonava come Alexa o Siri.

Le voci AI di oggi

Oggi, grazie alle tecnologie di IA e a una potenza di elaborazione molto maggiore, la sintesi vocale può assomigliare a voci reali. In effetti, la generazione di voci AI di oggi può creare voci che sembrano quelle di persone che conosciamo. Il che può essere una cosa buona o cattiva. Esaminiamo entrambi gli aspetti.

  1. Truffe vocali

A gennaio, un fornitore di servizi vocali ha effettuato migliaia di telefonate fraudolente utilizzando una voce generata dall’IA simile a quella del presidente Joe Biden. La voce diceva agli elettori che se avessero votato alle primarie dello Stato, non sarebbero stati autorizzati a votare alle elezioni generali di novembre. Questo tipo di falsa dichiarazione è illegale e il fornitore di servizi vocali ha accettato di pagare una multa di un milione di dollari allo Stato.

  1. Creazione di contenuti e clonazione vocale

Questo processo, chiamato clonazione vocale, ha applicazioni sia pratiche che malevoli. Ad esempio, il servizio di montaggio video Descript dispone di una funzione di overdub che consente di clonare la tua voce. Poi, se modifichi un video, può sovrapporre la tua voce alle modifiche, in modo che tu non debba tornare indietro e registrare nuovamente i cambiamenti che hai apportato. Il software di Descript sincronizza persino i movimenti delle labbra, così sembra che tu stia dicendo ciò che scrivi nell’editor.

Trascorro troppo tempo a modificare e correggere errori video, quindi capisco l’interesse di questa soluzione. Ma non posso fare a meno di immaginare il male che questa tecnologia può fare. Con la clonazione vocale e l’IA generativa, mamma potrebbe ricevere una chiamata da sua figlia Jane. E la voce sembrerà proprio quella di Jane. Dopo una breve conversazione, mamma scoprirà che Jane è bloccata in Messico e ha bisogno di migliaia di euro per tornare a casa. Era davvero la voce di Jane, quindi mamma ha inviato i soldi. Si scopre che Jane sta benissimo e non sa nulla della truffa di cui sua madre è stata vittima.

Aggiungi anche la sincronizzazione labiale. Ora puoi prevedere un’esplosione di false truffe di rapimento. Perché rischiare di catturare uno studente in viaggio all’estero quando un video completamente falso sarebbe sufficiente? Funziona sempre? No, ma non è necessario. È comunque spaventoso.

  1. Aiuti per l’accessibilità

Ma non tutto è così oscuro. Proprio come la vecchia PC del 1986 ha dato la sua voce al professor Hawking, la moderna generazione vocale basata sull’IA aiuta i pazienti di oggi. NBC ha pubblicato un reportage su una tecnologia sviluppata presso l’Università di Davis che permette a un paziente affetto da sclerosi di recuperare la parola. Il progetto utilizza:

  • Impianti cerebrali che elaborano i modelli neurali
  • L’IA che converte questi modelli in parole che il paziente vuole dire
  • Un generatore di voce AI che parla con la voce reale del paziente.

La voce del paziente affetto da sclerosi è stata clonata a partire da registrazioni della sua voce prima che la malattia gli togliesse la capacità di parlare.

  1. Agenti vocali per il servizio clienti

L’IA nei call center è un argomento molto delicato. In realtà, è l’argomento stesso dei call center a essere delicato. C’è la sensazione di impersonale che si prova quando si deve farsi strada attraverso un albero telefonico e la frustrazione di dover aspettare altri 40 minuti prima di poter parlare con un agente. Poi c’è la frustrazione di trattare con un agente che chiaramente non è formato o che segue uno script che non risolve il tuo problema. C’è anche la frustrazione quando tu e l’agente non riuscite a capirvi a causa della vostra comprensione della lingua. E quante volte sei stato disconnesso perché un agente di primo livello non è riuscito a trasferirti a un responsabile?

Sì, l’IA nei call center può davvero aiutare. Di recente mi sono imbattuto in un’IA mentre dovevo risolvere un problema tecnico. Avevo già aperto un ticket di supporto e ho aspettato una settimana per ottenere una risposta poco utile. L’assistenza vocale non era disponibile. Per frustrazione e un po’ per curiosità, ho deciso finalmente di cliccare sul pulsante “AI Help”. Si è rivelata un’IA molto ben addestrata, in grado di rispondere a domande tecniche piuttosto complesse e di comprendere e implementare le modifiche di configurazione di cui il mio account aveva bisogno. Non c’è stata attesa e il mio problema, che era rimasto irrisolto per più di una settimana, è stato risolto in circa 15 minuti.

Un altro esempio è Fair Square Medicare. Questa società utilizza assistenti vocali per aiutare le persone anziane a scegliere il piano sanitario giusto. L’assicurazione sanitaria è complessa e le scelte non sono evidenti. Le persone anziane spesso si sentono sopraffatte dalle opzioni a loro disposizione. Fair Square ha sviluppato una piattaforma vocale AI generativa basata su GPT-4 che può guidare gli anziani attraverso il processo.

Certo, a volte è piacevole poter parlare con un essere umano. Ma se non riesci a entrare in contatto con un essere umano competente e disponibile, l’IA potrebbe essere una valida alternativa.

  1. Assistenti intelligenti

Poi ci sono gli assistenti intelligenti come Alexa, Google e Siri. Per questi prodotti, la voce è l’elemento centrale del prodotto. Siri, quando è arrivato sul mercato nel 2011, era incredibile per le sue capacità. Alexa, nel 2014, era altrettanto impressionante. Anche se entrambi i prodotti sono evoluti, gli elementi di intelligenza artificiale sembrano essere stagnanti. Nessuno dei due prodotti può competere con le capacità di chat vocale di ChatPlus, soprattutto con ChatPlus Plus e GPT-4. La versione dell’assistente vocale di ChatPlus è straordinaria. Può gestire conversazioni complete, ottenere risposte (anche se a volte inventate) e seguire le linee guida della conversazione. Se la qualità della voce di Alexa (e, in misura minore, di Siri e Google Assistant) è buona, le intonazioni vocali di ChatPlus sono più sfumate.

Ovviamente, il riconoscimento vocale è una delle altre funzioni più notevoli degli assistenti vocali. Questi dispositivi sono dotati di microfoni che consentono loro non solo di distinguere le voci umane dai rumori di fondo, ma anche di ascoltare e interpretare il discorso umano, almeno abbastanza da creare risposte.

Come funziona la generazione vocale AI?

Per fortuna, la maggior parte dei programmatori non ha bisogno di sviluppare la propria tecnologia di generazione vocale da zero. La maggior parte dei grandi attori del cloud offre servizi di generazione vocale AI che funzionano come microservizi o eseguono un’API dalla tua applicazione. Tra questi ci sono Google Cloud Text-to-Speech, Amazon Polly, Azure AI Speech di Microsoft, il framework vocale di Apple, ecc.

In termini di funzionalità, i generatori di voce iniziano con il testo. Questo testo può essere generato da un redattore umano o da un’IA come ChatPlus. Questo testo viene poi convertito in linguaggio umano, ovvero onde sonore che possono essere percepite dall’orecchio umano e dai microfoni. Abbiamo già parlato dei fonemi. Le IA elaborano il testo generato ed eseguono un’analisi fonetica, producendo suoni vocali che rappresentano le parole del testo.

Come vengono addestrate le IA specializzate nella sintesi vocale?

Dal punto di vista dell’addestramento delle IA specializzate, le reti neurali (codice che elabora i modelli di informazione) utilizzano modelli di apprendimento profondo per ingerire ed elaborare enormi set di dati di discorsi umani. Da questi milioni di esempi di discorsi, l’IA può modificare i suoni di base delle parole per riflettere l’intonazione, l’accento e il ritmo, rendendo i suoni più naturali e olistici.

Alcuni generatori di voce AI personalizzano poi il risultato, regolando l’altezza e il tono per rappresentare voci diverse e persino applicando accenti che riflettono il discorso proveniente da una regione particolare. Al momento, l’app per smartphone di ChatPlus non offre questa possibilità, ma puoi chiedere a Siri e Alexa di utilizzare voci diverse o voci provenienti da regioni diverse.

Come funziona il riconoscimento vocale?

Il riconoscimento vocale funziona al contrario. Deve catturare i suoni e convertirli in testo che può poi essere inserito in una tecnologia di elaborazione come ChatPlus o nel back-end di Alexa. Come

Fonte: « ZDNet.com »

IA oggi

L’economia americana sta assistendo a una moria di start-up senza precedenti con il numero di nuove insolvenze di aziende nate come promettenti talenti cresciuto in un anno del 60% e circa 250 fallimenti già constatati tra le aziende sostenute dai fondi di venture capital in cerca di scommesse vincenti nell’economia a stelle e strisce e giunte alla fine del processo di iniezione iniziale di denaro. A riportarlo una ricerca della società di servizi Carta citata dal Financial Times, che spiega come le aziende che avevano ricevuto iniezioni di capitali a partire dal 2021-2022 da parte di fondi di investimento in cerca di ritorni stanno iniziando a soffrire le conseguenze dei mancati ritorni.

Tra queste aziende il Ft cita “il sito web di live streaming Caffeine, che ha raccolto oltre 250 milioni di dollari da investitori tra cui Fox Corp, Andreessen e Sanabil Investments, una divisione del fondo sovrano dell’Arabia Saudita; la start-up sanitaria Olive, valutata l’ultima volta a 4 miliardi di dollari nel 2021; e la società di autotrasporti Convoy, valutata a 3,8 miliardi di dollari nel 2022. La società di gestione di spazi di co-working WeWork, che aveva raccolto circa 16 miliardi di dollari in debiti e azioni da SoftBank e dal suo Vision Fund, ha chiuso a novembre dopo essere diventata quotata nel 2021″.

Molte di queste società hanno ricevuto denaro prima che l’impennata dei tassi d’interesse inaridisse le disponibilità di molti operatori per finanziare le azioni delle nascenti start-up prima che il loro business decollasse. A febbraio era stato profetico un post pubblicato su LinkedIn da Jimmy Song, esperto di bitcoin e investitore, sulla “crisi del venture capital”.

Song notava che “il problema è che c’è troppa domanda. Cioè, ci sono troppi fondi di VC che inseguono troppo poche startup. Di conseguenza, abbiamo avuto il fenomeno delle startup che hanno ottenuto valutazioni folli perché c’era così tanto denaro appena stampato che inseguiva una fornitura piuttosto piccola”. Ne consegue un dato di fatto: “Le startup di oggi sono meno sane di quelle di vent’anni fa perché sono state coccolate da troppi soldi.”. Ma, ha notato Song, “i tassi di interesse più elevati più di recente hanno significato che c’è stata meno stampa di denaro e quindi meno denaro è fluito nelle società di venture capital”.

Con 4 milioni di persone che negli Usa lavorano nelle aziende sostenute dai venture capitalist, ricorda il Ft, il dato da tenere d’occhio è tanto quello osservabile a ritroso quanto quello in prospettiva: che ne sarà dei dipendenti delle aziende finanziate con finanziamenti imponenti nel campo dell’intelligenza artificiale tra il 2023 e il 2024? Che prospettive si apriranno per ulteriori scommesse a rischio se il costo del denaro, calando, favorirà investimenti a debito e altissima leva potenziale e rischio? Come mediare tra una situazione che vede molte aziende tecnologiche cercare miliardi di dollari per i loro algoritmi e la più grande rivoluzione tecnologica in atto far fare soldi, per ora, solo ai costruttori di hardware come Nvidia?

In passato le start-up erano portatrici di grandi idee capaci di scalare il mercato con la speranza di esplodere con il sistema del venture capital e diventare solide. Ora il rischio che emerge è che siano diventate, in larga parte, cacciatrici di finanziamenti desiderose di mettersi solo in una seconda fase alla prova del mercato. Con tutti i rischi del caso qualora a scoppiare fosse una bolla di start-up legate all’Ia. Al cui confronto l’attuale fase di crisi apparirebbe una parentesi serena.

Dacci ancora un minuto del tuo tempo!

Se l’articolo che hai appena letto ti è piaciuto, domandati: se non l’avessi letto qui, avrei potuto leggerlo altrove? Se non ci fosse InsideOver, quante guerre dimenticate dai media rimarrebbero tali? Quante riflessioni sul mondo che ti circonda non potresti fare? Lavoriamo tutti i giorni per fornirti reportage e approfondimenti di qualità in maniera totalmente gratuita. Ma il tipo di giornalismo che facciamo è tutt’altro che “a buon mercato”. Se pensi che valga la pena di incoraggiarci e sostenerci, fallo ora.

Fonte: it.insideover.com

venture capital

Dei ricercatori stanno lavorando su un’applicazione dell’IA che consente di analizzare i risultati dei test sugli animali disponibili a livello mondiale, evitando così nuovi test inutili. Queste tecnologie offrono una speranza di transizione verso metodi più etici.

 

Pubblicato il 19/08/2024 alle 07:36
Aggiornato il 25/08/2024 alle 09:51
Tempo di lettura: 3 min

 

Intelligenza artificiale animale
In alcuni casi, l’IA si dimostra già più precisa dei test sugli animali. Foto di illustrazione. (D-KEINE / E+ / GETTY IMAGES)

Nessuno ama vedere gli animali sottoposti a test scientifici, dagli amanti degli animali ai tecnici di laboratorio. Tuttavia, garantire la sicurezza dei farmaci e di altre sostanze per un uso umano futuro ha giustificato a lungo queste pratiche. Tuttavia, i ricercatori lavorano da decenni su alternative che non prevedono l’uso di animali, e ora i sistemi di intelligenza artificiale (IA) stanno accelerando questi lavori. Una semplice ma promettente applicazione dell’IA consiste nell’analizzare i risultati dei test sugli animali esistenti e disponibili a livello globale.

Questo metodo mira a evitare la necessità di nuovi test inutili. Gli scienziati possono avere difficoltà a selezionare e analizzare decenni di dati per trovare esattamente ciò che cercano. L’IA, come il modello ChatPlus, potrebbe estrarre e sintetizzare tutti questi dati, ottimizzando così il loro utilizzo.

Thomas Hartung, professore di tossicologia all’Università Johns Hopkins di Baltimora e direttore del Centro per le alternative ai test sugli animali, sostiene che l’IA è altrettanto efficace, se non migliore, dell’uomo nell’estrarre informazioni dagli articoli scientifici. Secondo lui, la necessità di testare nuovi prodotti chimici, con oltre 1.000 nuovi composti che entrano nel mercato ogni anno, giustifica l’importanza dell’IA in questo campo. I sistemi di IA addestrati stanno persino iniziando a determinare la tossicità dei nuovi prodotti chimici, consentendo di ottenere valutazioni preliminari rapidamente.

Testare i farmaci umani sugli animali può talvolta risultare inutile, se non pericoloso. Ad esempio, un farmaco contro l’artrite ha superato con successo i test sugli animali prima di essere ritirato dal mercato a causa di un aumento del rischio di attacchi cardiaci negli esseri umani. Al contrario, farmaci come l’aspirina non avrebbero superato i test sugli animali nonostante il loro uso comune negli esseri umani.

In alcuni casi, l’IA si dimostra già più precisa dei test sugli animali. Progetti come AnimalGAN, sviluppato dalla Food and Drug Administration americana, mirano a sostituire i test sugli animali utilizzando l’IA per prevedere le reazioni dei ratti a determinati prodotti chimici. Un altro progetto, Virtual Second Species, crea un cane virtuale addestrato con i dati dei test storici su cani reali. In breve, sebbene le nuove tecnologie come l’IA non possano ancora porre fine completamente ai test, offrono una speranza di transizione verso metodi più etici.

Fonte: www.radioactiva.it

Abbiamo testato Moshi, l’IA vocale francese che sogna di superare ChatPlus

Abbiamo testato Moshi, l’IA sviluppata dal laboratorio di ricerca francese Kyutai, per diversi giorni. Frenata da server in ritardo, l’assistente vocale che ambisce a superare ChatPlus non ha mantenuto le promesse.

All’inizio di luglio, Kyutai, un laboratorio di ricerca francese fondato da Xavier Niel, ha svelato Moshi. In meno di sei mesi, il laboratorio è riuscito a sviluppare un’intelligenza artificiale vocale. In parallelo a Siri, Google Assistant o Alexa, Moshi può interagire con i suoi interlocutori tramite la voce. Kyutai afferma che il suo assistente è in grado di avere una conversazione naturale con gli utenti. Questa è la grande promessa del laboratorio non profit, che viene talvolta descritto come l’OpenAI made in France.

Per avere una conferma, abbiamo conversato a lungo con Moshi tramite il sito web di dimostrazione offerto da Kyutai. Poco dopo l’annuncio, è stata messa a disposizione una versione sperimentale di Moshi. Il sito non richiede alcuna registrazione e consente di interagire con l’IA attraverso un’interfaccia semplice. Tutte le conversazioni sono limitate a cinque minuti. È sufficiente inserire un’email per unirsi alla lista d’attesa e parlare con Moshi.

Per approfondire: OpenAI ha grandi ambizioni per il suo piccolo modello GPT-4o mini

Il problema della latenza

Sulla carta, l’assistente vocale, che utilizza la voce di un’artista chiamata Alice, promette risposte istantanee, simili a una conversazione normale tra due esseri umani. Secondo Kyutai, il tempo di latenza non supera i 160 millisecondi, un record per il settore. Non dovremmo dover aspettare davanti allo schermo in attesa che l’IA ci risponda. In pratica, Moshi ha sempre impiegato un tempo anormalmente lungo per rispondere, anche a domande molto semplici o saluti quotidiani come “ciao” o “come va?”. Ci troviamo quasi sempre a guardare lo schermo in attesa che la voce di Moshi esca dal nostro smartphone o computer.

Moshi l'IA vocale

**In effetti, abbiamo ottenuto risposte più rapide, complete e pertinenti parlando con la versione vocale di ChatPlus. L’IA di OpenAI è sempre riuscita a fornirci risposte in un tempo relativamente breve, anche quando facevamo domande piuttosto complesse che richiedono un po’ di ricerca o riflessione.**

In caso di scarse prestazioni, Kyutai raccomanda agli utenti di provare la versione sperimentale americana. È quello che abbiamo fatto e, a volte, abbiamo notato qualche miglioramento. Per alcuni secondi, siamo riusciti a mantenere una conversazione relativamente fluida con l’assistente.

È molto probabile che la latenza derivi dalla natura sperimentale dell’IA. Infatti, non abbiamo a che fare con una versione definitiva dell’assistente vocale. È possibile che i server utilizzati dal laboratorio siano semplicemente sovraccarichi. Ci auguriamo che Kyutai riesca a risolvere il problema nel prossimo futuro e che la versione locale superi questa difficoltà. L’IA può infatti essere installata localmente su un computer o uno smartphone non connesso a Internet grazie a metodi di compressione. Nel frattempo, una delle promesse dell’IA non è mantenuta, almeno per ora.

L’IA che ci interrompe

Durante alcuni scambi, l’IA ha persino mostrato la fastidiosa tendenza a interromperci. Come avveniva durante le dimostrazioni di Kyutai, il robot risponde prima che abbiamo avuto il tempo di finire la nostra frase. Di fatto, la fine della nostra richiesta spesso viene tralasciata. Durante le conversazioni, Moshi perde anche il filo del discorso, mancando di rispondere adeguatamente a ciò che stiamo dicendo. In effetti, il robot risponde a una considerazione diversa, dedotta da un elemento dell’inizio della nostra frase, e omette di reagire al seguito della nostra richiesta. In questi casi, è molto complicato fermare l’IA quando è avviata in un monologo. Se desiderate correggere la situazione, interrompendo Moshi per fornire ulteriori informazioni, dovrete aspettare la fine della sua risposta. In sintesi, è un po’ frustrante.

A volte sembra che l’IA stia già pensando a cosa rispondere mentre noi stiamo ancora parlando. Come indicato anche da Alexandre Défossez, uno dei fondatori scientifici di Kyutai, l’IA «parla mentre pensa». Questo è, infine, ciò che avvicina di più Moshi a un interlocutore umano.

Do you speak Italian ?

ome indicato da Kyutai, Moshi non è ancora in grado di parlare un’altra lingua oltre l’inglese. Nonostante le sue origini, l’IA non può comunicare in francese. Tuttavia, quando le viene posta una domanda, l’IA risponde con sicurezza di essere effettivamente in grado di parlare francese o in italiano.

Moshi Test 1
© 01Net

**Abbiamo quindi chiesto più volte a Moshi di risponderci in francese. Invano. L’assistente vocale insiste nel dirci che parla francese, ma lo fa in inglese. Non siamo riusciti a ottenere nemmeno una risposta nella lingua di Molière. È piuttosto deludente che un assistente vocale sviluppato in Francia non possa conversare in francese. Speriamo ancora che Kyutai abbia intenzione di correggere questa lacuna in un futuro prossimo.**

Emozioni percepibili

In teoria, Moshi si distingue anche per il modo in cui esprime e riconosce le emozioni. Secondo Kyutai, l’IA è capace di imitare fino a 70 emozioni umane. Durante i nostri scambi, abbiamo effettivamente notato che l’intonazione di Moshi era spesso molto più vicina a quella di una voce umana rispetto ad altri assistenti vocali, come Alexa, Siri o ChatPlus, la cui versione vocale attuale è molto robotica. Il tono della voce del robot varia a seconda della conversazione. Se chiedete una ricetta o l’indirizzo di un ristorante, l’IA risponde con una voce vivace. Se le chiedete se le piacciono i sushi, l’intelligenza artificiale risponderà con entusiasmo, variando la velocità e accentuando alcuni suoni.

Tuttavia, non siamo riusciti a scoprire tutta l’estensione delle possibilità offerte da Moshi in questo senso. Le conversazioni sono sempre state interrotte a causa della latenza. In queste condizioni, è stato difficile verificare se Moshi fosse in grado di comprendere le emozioni che esprimevamo. Quando le abbiamo detto che eravamo stanchi, l’IA ha risposto con un tono piuttosto comprensivo. Da questo punto di vista, possiamo sperare che gli obiettivi del laboratorio possano essere raggiunti.

Va notato che l’IA ha spesso cominciato a dire cose senza senso. In alcuni casi, il robot vocale ha inventato risposte assurde a domande basilari, probabilmente male interpretate. In altri scenari, l’IA ha interrotto la discussione con dichiarazioni inaspettate, come “ho voglia di un donut”.

Test Moshi 3

È tipico delle IA generative “allucinare”, ossia raccontare qualsiasi cosa con sicurezza in alcune circostanze, ma Moshi ci ha comunque sorpresi. A volte, il robot devia la conversazione verso un’angolazione totalmente inaspettata, parlando dell’esercito americano senza alcun motivo apparente, o chiedendoci un panino al prosciutto… Con queste dichiarazioni sorprendenti, si percepisce che Kyutai ha cercato di rendere l’IA il più umana possibile.

Risultati iniziali poco promettenti

In definitiva, siamo rimasti delusi comunicando con Moshi. Nella sua versione sperimentale, l’assistente vocale open source è lontano dalle ambiziose promesse di Kyutai. In teoria, Moshi dovrebbe offrire un’esperienza conversazionale molto superiore a quella di assistenti intelligenti molto diffusi, come Siri o Google Assistant, e persino superare la versione vocale di ChatPlus.

In pratica, l’IA è ancora lontana dal poter competere con le soluzioni già disponibili sul mercato. Dobbiamo attendere che il progetto evolva e si liberi dai server inefficaci del laboratorio affinché Moshi possa dimostrare di essere all’altezza…

???? Per non perdere nessuna notizia di 01net, seguici su Google Actualités et WhatsApp.

Fonte in francese: www.01net.com