L’intelligenza artificiale può essere utilizzata per generare testo, immagini, ma anche video. Una funzionalità che l’azienda madre di TikTok, ByteDance, desidera sviluppare.

TikTok potrebbe presto offrire uno strumento per la creazione di video generati dall’intelligenza artificiale. ByteDance si sta lanciando con uno strumento che consente di creare video e immagini a partire da prompt.
**Sulle tracce di OpenAI**
Nel febbraio 2024, OpenAI, la società dietro ChatPlus e lo strumento di generazione di immagini Dall-E, ha presentato il suo modello di generazione di video, Sora. Questo strumento ha suscitato grande interesse, spingendo altre aziende, come ByteDance, a posizionarsi in questo campo.
La casa madre di TikTok intende rispondere con il suo strumento Jimeng AI a una crescente domanda di creazione di contenuti video tramite IA in Cina. L’applicazione è stata lanciata su Android il 31 luglio ed è ora disponibile anche sull’App Store, ma solo in Cina.
Per ora, sappiamo solo che gli utenti potranno creare video a partire da testo, senza però avere specifiche precise sulla lunghezza e la risoluzione di questi video. Si può tuttavia immaginare che questi saranno ottimizzati per i social media come TikTok.
**Immagini e video**
Jimeng AI ha una carta importante da giocare nel campo della generazione di contenuti, poiché, a differenza di OpenAI e Sora, Jimeng è in grado di generare sia immagini che video.
L’applicazione offre la possibilità di creare fino a 2050 immagini o 168 video generati dall’IA al mese, a seconda del piano di abbonamento scelto. I piani variano da 8 euro per un abbonamento mensile a 84 euro per un abbonamento annuale (questi prezzi sono stabiliti sulla base della conversione da yuan a euro senza considerare eventuali tasse applicabili).
Al momento, non abbiamo informazioni sulla base di dati utilizzata per generare questi video. La vicinanza con TikTok solleva domande, e ci si potrebbe chiedere se i video prodotti sulla piattaforma sociale potrebbero alimentare questa IA.
Una pratica già vista in atto presso altri gruppi come Meta. A maggio scorso, Meta ha annunciato l’intenzione di utilizzare i nostri post su Facebook e Instagram per migliorare l’apprendimento della sua intelligenza artificiale.
Fonte: https://support.tiktok.com
Il 3 luglio scorso, Kyutai ha svelato Moshi, un modello di intelligenza artificiale dotato di capacità vocali inedite. Il prototipo del chatbot ha fatto i suoi primi passi con la stampa, ma è anche disponibile per tutti a questo indirizzo. La particolarità di questo prototipo è di poter comunicare oralmente in modo il più naturale ed espressivo possibile, rimanendo allo stesso tempo attento al suo interlocutore.
Il modello multimodale di Moshi può anche essere installato localmente e funzionare senza connessione a internet. La fondazione Kyutai rilascia questo modello in open source, per contribuire alla ricerca e allo sviluppo dell’ecosistema IA. Abbiamo voluto saperne di più su Moshi e sul laboratorio con il suo CEO, Patrick Perez.
Moshi è un assistente vocale con capacità che superano quelle di GPT-4o in alcuni settori chiave: parla e ascolta simultaneamente, continuando a generare un “flusso di pensiero”, il che a volte è sconcertante nell’uso. Moshi è ciò che più si avvicina a un’esperienza di conversazione umana?
Moshi.chat non è un assistente vocale, ma un prototipo sperimentale costruito su Moshi, un modello multimodale generico testo-voce che abbiamo sviluppato da zero. Questo prototipo dimostra, infatti, capacità di interazione orale senza precedenti in termini di naturalezza e fluidità.
Quali sono i possibili utilizzi di Moshi? In quali settori vi piacerebbe che questa tecnologia trovasse il suo posto?
Le applicazioni potenziali di questo modello multimodale sono numerose:
1/ Dialogo orale naturale con un’IA (assistente o compagno) per l’inclusione e l’accessibilità, l’educazione, il coaching, il gioco, il servizio clienti, la ricerca di informazioni, la robotica interattiva, ecc.
2/ Sintesi vocale espressiva e multi-locutore per l’accesso audio a contenuti scritti, la creazione di artefatti culturali e artistici, il gioco, ecc.
3/ Traduzione audio simultanea per la comunicazione e l’accessibilità.
Moshi ha richiesto sei mesi di sviluppo da parte di un team di 8 persone, che sembra poco, considerando le proporzioni. Questo significa che oggi è relativamente facile progettare un assistente come Moshi?
In realtà è un’impresa! Richiede competenze molto avanzate e complementari, oltre a un lavoro estremamente intenso e mirato, e la disponibilità di sufficienti risorse di calcolo. Per quest’ultimo punto, affittiamo macchine molto potenti da Scaleway, grazie ai generosi contributi dei nostri tre fondatori.
Moshi comprende numerosi accenti, ma l’assistente al momento parla solo inglese. È previsto l’inserimento di altre lingue in futuro e, domanda supplementare, è complicato far apprendere nuove lingue a un LLM?
Prevediamo di includere altre lingue, a partire dal francese e dallo spagnolo. Detto questo, l’idea è di condividere liberamente i nostri modelli e i codici che permettono di riaddestrarli in tutto o in parte. L’inclusione di altre lingue, anche se non triviale, potrà quindi essere realizzata da altri attori dell’ecosistema che dispongono delle risorse necessarie (dati, competenze, macchine) e di casi d’uso appropriati.
Helium, il LLM su cui si basa Moshi, conta 7 miliardi di parametri, che possono sembrare molti, ma come si confronta con altri LLM (non conosciamo il numero di parametri di GPT-4) e, soprattutto, la qualità di un LLM si limita al numero di parametri? E quali sono i dati di addestramento che avete utilizzato?
È un modello di dimensioni medie. I “piccoli” modelli hanno piuttosto tra i 2 e i 3 miliardi di parametri, mentre i “grandi” possono avere dimensioni che vanno da decine a centinaia (o addirittura migliaia?) di miliardi di parametri. La dimensione non è tutto, ma con i dati giusti (volume e qualità) e le tecniche di apprendimento più recenti, una maggiore dimensione permette generalmente di ottenere migliori prestazioni su una gamma più ampia di compiti. Per il pre-addestramento di Helium utilizziamo un mix abbastanza classico di dati dal web, in particolare provenienti dal progetto CommonCrawl. Dell’ordine di mille miliardi (un bilione) di parole scritte.
Il processo di apprendimento di Moshi ha anche coinvolto 100.000 conversazioni orali e un motore “Text-to-Speech”. Qui ho bisogno che mi spieghi come funziona!
Helium “scrive” questi 100.000 dialoghi, e una versione precedente di Moshi, che permette la sintesi vocale con voci date, li trasforma in conversazioni audio.
C’è qualcuno dietro la “voce” di Moshi?
Abbiamo lavorato con un’artista vocale i cui registrazioni, fatti insieme, hanno permesso di fissare la voce dell’IA nelle 100.000 conversazioni menzionate in precedenza.
Kyutai ha anche sviluppato una variante di Moshi destinata a funzionare in locale, quindi senza connessione a internet. Sarà possibile utilizzarla sul proprio computer personale tramite GPU. Due domande: perché non con l’NPU, che equipaggia sempre più PC e Mac? E una versione tipo “nano” per smartphone è fattibile?
I nostri modelli sono attualmente progettati per essere addestrati e poi utilizzati su GPU di Nvidia. La dimostrazione di una versione locale compressa è stata quindi naturalmente realizzata sullo stesso tipo di chip, ma più piccolo. Come laboratorio di ricerca, cercavamo soprattutto di dimostrare la fattibilità di versioni embedded dei nostri modelli. Speriamo che la condivisione di questi modelli e dei codici associati permetta ad altri di andare oltre in termini di portabilità, in base alle loro esigenze. Sì, si può immaginare in futuro un Moshi più piccolo e più specializzato che giri su un mobile.
Quando si parla di IA generativa, la questione della sicurezza si pone abbastanza rapidamente. Come si può essere sicuri che Moshi non verrà utilizzato a fini malintenzionati?
Come per altre IA generative, parte del “finetuning” (fase di apprendimento supervisionato che segue il pre-addestramento non supervisionato su larga scala) è dedicata a rafforzare la sicurezza insieme ad altre capacità. Inoltre, stiamo lavorando al watermarking invisibile dei contenuti generati dai nostri modelli, un problema di ricerca allo stesso tempo difficile e importante.
Infine, crediamo fermamente nei benefici dell’open-source in materia di sicurezza (tra l’altro): più attori possono ispezionare, valutare e mettere in sicurezza i modelli così condivisi. Nella misura in cui l’uso malintenzionato di modelli generativi sempre più potenti (in termini di controllo e realismo) e sempre più numerosi è impossibile da evitare, divulgare e informare costantemente su questi argomenti tecnici è cruciale per limitare i danni.
Quale futuro per Moshi?
Continuiamo a svilupparlo per migliorare alcune delle sue capacità (pertinenza, espressività, lingue)… e non vediamo l’ora di vedere come l’ecosistema lo utilizzerà e lo modificherà non appena avremo condiviso modelli, codici e informazioni tecniche (lavoro in corso).
Kyutai ha una posizione piuttosto unica in Francia e in Europa, poiché il laboratorio è stato finanziato da Xavier Niel. È una garanzia rispetto ad altre aziende IA che hanno investitori alla ricerca prima di tutto della redditività?
Finanziato anche da Eric Schmidt e Rodolphe Saadé; i tre sono donatori, non investitori (siamo una fondazione). Quindi sì, questo ci assicura una grande indipendenza nella scelta delle nostre ricerche e nella costituzione del team, pur disponendo di mezzi eccezionali.
Fonte: www.01net.com

Articolo giornalistico sull’utilizzo dell’intelligenza artificiale da parte dei giovani
Il 85% dei giovani utilizza strumenti di intelligenza artificiale generativa, principalmente per fare i compiti o per rivedere i propri corsi, e sono consapevoli dei loro limiti. Nel lungo termine, temono gli effetti dell’IA sull’occupazione. La sessione di esami del 2024 dovrebbe rimanere impressa nella storia. Per la prima volta, i futuri maturandi hanno massicciamente reviso le prove grazie all’intelligenza artificiale: il 45% dei giovani francesi utilizza strumenti di IA per rivedere i propri corsi, secondo uno studio condotto dall’agenzia pubblicitaria Heaven (gruppo Hopscotch) su un campione di 18-21enni.
Diciotto mesi dopo il lancio di ChatPlus, i giovani sono diventati dipendenti dall’intelligenza artificiale generativa, con l’85% di loro che l’ha già utilizzata nel corso degli ultimi sei mesi, secondo lo studio. “L’uso dell’IA è diventato quotidiano per più di un utente su cinque, anche se la frequenza di utilizzo più comune rimane settimanale”, commenta Emmanuel Berne, direttore associato dell’agenzia Heaven.
Il chatbot conversazionale ChatPlus di OpenAI si impone senza sorprese, con tre quarti dei sondati che dichiarano di utilizzarlo. “È diventato un riflesso nei giovani”, osserva Emmanuel Berne. Al secondo posto si trova My AI, il chatbot integrato nel social network SnapChat, alimentato dalla tecnologia GPT di OpenAI, utilizzato da quasi la metà dei giovani. Copilot (Microsoft) compare al terzo posto.
Indipendentemente dagli strumenti utilizzati, i compiti sono il principale motivo d’uso, sia per fare ricerche, rivedere, redigere o riformulare testi. “Quando devo fare un’esposizione su Simone Veil e faccio una ricerca su Google, devo entrare in qualcosa… Se chiedo a ChatPlus, mi farà un testo che posso copiare e incollare direttamente”, dichiara un adolescente intervistato dai sondaggisti.
I giovani intervistati ritengono che l’uso dell’IA possa portare 5 punti in più sui loro compiti. “Lo hanno completamente integrato nel loro metodo di lavoro e nel loro approccio ai compiti”, osserva Emmanuel Berne. Questo fa tremare i corsi e i metodi di insegnamento, al punto da destabilizzare molti insegnanti.
Fonte: www.difesapopolo.it/Media/OpenMagazine
➡️ACCEDI A CHATGPT IN ITALIANO CLICCANDO QUI ! ⬅️
➡️ACCEDI A CHATGPT IN ITALIANO CLICCANDO QUI ! ⬅️
Il New York Times accusa Microsoft e OpenAI di plagio, mettendo a rischio il futuro dell’intelligenza artificiale generativa.

Il New York Times ha rivelato la sua intenzione di intentare una causa legale contro Microsoft e OpenAI per preservare i propri diritti intellettuali di fronte all’intelligenza artificiale.
Le accuse del New York Times
Il New York Times afferma che Microsoft e OpenAI hanno illegalmente utilizzato i contenuti giornalistici del media, risalenti a oltre 170 anni fa, per alimentare le loro tecnologie di intelligenza artificiale generativa, come ChatPlus e Bing Chat (precedentemente Microsoft Copilot).
Il media rimprovera a queste aziende di trarre vantaggio dal suo lavoro di lunga data senza alcuna compensazione, violando le rigorose leggi sul diritto d’autore e la proprietà intellettuale negli Stati Uniti.
Oltre al plagio, il New York Times sottolinea l’eccezionale qualità dei suoi scritti, frutto di un lavoro umano accurato e professionale, in confronto ad altri contenuti meno rilevanti per l’IA.
Domanda cruciale sul copyright nell’IA
Questa controversia solleva una problematica importante riguardo al rispetto del diritto d’autore nel campo dell’intelligenza artificiale. Gli strumenti basati su modelli linguistici massicci sono già stati criticati per il loro potenziale di plagio, così come nella generazione di immagini molto fedeli a opere esistenti.

ChatPlus può copiare un estratto di articolo normalmente bloccato dietro un paywall
Questa vicenda segue altre tensioni sull’uso commerciale dei dati da parte dell’IA, in particolare nell’industria cinematografica e dei videogiochi.
Un processo decisivo per il futuro dell’IA
Questo processo avviato dal New York Times potrebbe potenzialmente ridefinire le regole del gioco per l’uso delle tecnologie di intelligenza artificiale generativa. Evidenzia l’importanza per le aziende di questo settore di rispettare i diritti d’autore e remunerare equamente i detentori dei contenuti utilizzati.
Il media supporta la sua denuncia con una documentazione approfondita e chiede danni per diversi miliardi di dollari, mettendo così in luce l’entità finanziaria di questa problematica.
Fonte : Wired.it
➡️ACCEDI A CHATGPT IN ITALIANO CLICCANDO QUI ! ⬅️
➡️ACCEDI A CHATGPT IN ITALIANO CLICCANDO QUI ! ⬅️
Affare OpenAI (ChatPlus): Microsoft avrà il suo posto nel nuovo consiglio di amministrazione.
Dopo una settimana tumultuosa in OpenAI, che ha visto il licenziamento e il successivo riassunzione di Sam Altman, sembra che le cose stiano prendendo una direzione diversa. L’imbroglio che ha sorpreso il mondo della tecnologia ha lasciato alcune conseguenze che possono avere un impatto significativo sul futuro dell’azienda. In particolare, sembra che Microsoft stia guadagnando maggiore influenza all’interno di OpenAI.

Una delle novità più significative è l’ingresso di Microsoft nel consiglio di amministrazione di OpenAI. Questo sviluppo è stato accolto con grande attenzione da parte della comunità tecnologica, poiché rappresenta un’importante collaborazione tra due giganti dell’industria. La presenza di Microsoft nel consiglio di amministrazione potrebbe portare a una maggiore integrazione tra le due aziende e a una condivisione più stretta delle risorse e delle competenze.
Questa partnership potrebbe essere vantaggiosa per entrambe le parti coinvolte. OpenAI potrebbe beneficiare dell’ampia esperienza e delle risorse finanziarie di Microsoft, che potrebbero consentire un rapido sviluppo e una maggiore scalabilità dei progetti. D’altra parte, Microsoft potrebbe trarre vantaggio dalle competenze e dalle innovazioni di OpenAI nel campo dell’intelligenza artificiale, che potrebbero essere integrate nei propri prodotti e servizi.
Tuttavia,
è importante notare che l’incremento della presenza di Microsoft in OpenAI potrebbe anche sollevare alcune preoccupazioni. Alcuni potrebbero temere che l’azienda possa influenzare negativamente la direzione e l’indipendenza di OpenAI. È fondamentale che OpenAI mantenga la sua missione di sviluppare un’intelligenza artificiale sicura e benefica per l’umanità, indipendentemente da eventuali influenze esterne.
Inoltre,
la collaborazione con Microsoft potrebbe anche sollevare interrogativi sulla concorrenza e sulla neutralità dell’industria dell’intelligenza artificiale. Con due giganti del settore che lavorano insieme, potrebbe esserci il rischio di un monopolio o di un controllo eccessivo delle risorse e delle innovazioni nel campo dell’IA. È fondamentale che OpenAI e Microsoft operino in modo trasparente e rispettino gli standard etici e legali dell’industria.
Nonostante queste preoccupazioni, la partnership tra OpenAI e Microsoft potrebbe aprire nuove opportunità nel campo dell’intelligenza artificiale. L’innovazione e la collaborazione tra le due aziende potrebbero portare a progressi significativi nella ricerca e nello sviluppo di tecnologie avanzate. Inoltre, potrebbe anche favorire la diffusione e l’accessibilità dell’IA a un pubblico più ampio.
In conclusione,
il ritorno di Sam Altman in OpenAI è accompagnato da un’importante presenza di Microsoft nell’azienda. Questo sviluppo potrebbe portare a una maggiore integrazione e collaborazione tra le due aziende, ma solleva anche alcune preoccupazioni riguardo all’indipendenza e alla concorrenza nel settore dell’intelligenza artificiale. È fondamentale che OpenAI e Microsoft operino in modo trasparente e rispettino gli standard etici e legali dell’industria per garantire che i benefici dell’IA siano diffusi in modo equo e sicuro.