Google DeepMind ha recentemente annunciato il lancio di due nuovi modelli di intelligenza artificiale per la robotica: Gemini Robotics e Gemini Robotics-ER. Questi modelli mirano a integrare l’IA nel mondo fisico, consentendo ai robot di eseguire compiti complessi sia in ambito industriale che domestico.
Gemini Robotics è un modello avanzato che combina visione, linguaggio e azione, permettendo ai robot di comprendere e interagire con l’ambiente circostante. Questo modello è stato testato su piattaforme robotiche come ALOHA 2, dimostrando la sua adattabilità in applicazioni complesse.
Gemini Robotics-ER si distingue per una comprensione spaziale avanzata, che consente ai robot di eseguire una vasta gamma di azioni con maggiore precisione. Questa caratteristica è fondamentale per applicazioni che richiedono un’interazione dettagliata con l’ambiente fisico.
L’obiettivo principale di questi modelli è rendere l’IA utile nel mondo fisico, superando le limitazioni precedenti che confinavano le capacità dell’IA al dominio digitale. Le dimostrazioni hanno mostrato robot che eseguono compiti come riporre una matita in un barattolo, cancellare una lavagna e spostare frutta in una ciotola.
Un aspetto cruciale nello sviluppo di questi modelli è l’adozione delle Tre Leggi della Robotica di Isaac Asimov, garantendo che i robot operino in modo sicuro e affidabile. Google ha introdotto un benchmark chiamato ASIMOV per identificare comportamenti potenzialmente pericolosi nei robot, assicurando che le azioni intraprese siano sicure per gli esseri umani.
Questi progressi rappresentano un passo significativo verso l’integrazione dell’IA nella vita quotidiana, con potenziali applicazioni che vanno dalla produzione industriale all’assistenza domestica, aprendo la strada a una nuova generazione di robot intelligenti e versatili.
Ora disponibile su Hugging Face, SynthID Text consente agli sviluppatori di applicare una filigrana invisibile sui testi generati da un’IA. Sebbene lo strumento non sia infallibile, Google spera che contribuirà a limitare la disinformazione prodotta da Gemini e simili..
Che sia voluto o meno, le IA come ChatPlus rischiano di diffondere sempre di più disinformazione // Fonte: Hartono Creative Studio via UnsplashI testi generati da ChatPlus o Claude sono onnipresenti. Nelle nostre comunicazioni professionali, nelle recensioni sulle piattaforme di e-commerce e inevitabilmente negli articoli pubblicati da alcuni media. Queste nuove intelligenze artificiali, pur essendo pratiche, presentano alcuni difetti importanti: sono lontane dall’essere infallibili e facilitano enormemente la diffusione di informazioni errate.
Le soluzioni per porvi rimedio non sono molte. Sebbene alcune aziende si sforzino di sviluppare strumenti per rilevare i contenuti generati da IA, questi sono imprecisi e possono anche accusare testi scritti da esseri umani.
Tuttavia, è possibile per gli sviluppatori applicare un filigrana sui contenuti generati dall’IA. Questo è il ruolo di SynthID Text di DeepMind, filiale di Google, che permette di identificare in modo invisibile per i lettori i risultati testuali prodotti dall’intelligenza artificiale.
Per fare ciò, lo strumento modifica leggermente il funzionamento delle IA, influenzando i token (o “gettoni”) che consentono loro di indovinare le parole o le lettere che devono apparire man mano che elaborano il testo. Ne risulta un modello riconoscibile da SynthID Text, che “non compromette la qualità, la precisione, la creatività o la rapidità della generazione del testo”, secondo quanto dichiarato da DeepMind in un post sul blog.
Un testo generato da Gemini con il filigrana di SynthID Text evidenziato in blu // Fonte: DeepMind
Uno strumento che non è infallibile, ma che potrebbe diventare obbligatorio
Ovviamente, SynthID Text non è privo di difetti. DeepMind sottolinea che “funziona meglio quando un modello linguistico genera risposte lunghe”. È in grado di rilevare anche testi parafrasati, ma inizia a mostrare i suoi limiti con risposte brevi, traduzioni o risposte molto fattuali. I testi che sono stati riscritti da esseri umani possono anche influire sulle prestazioni dello strumento.
Questo strumento è integrato di fatto in Gemini dalla scorsa primavera, ed è ora disponibile gratuitamente per sviluppatori e aziende sulla piattaforma Hugging Face. Se al momento queste non sono obbligate a utilizzare tali strumenti nei loro processi, alcuni regolatori potrebbero costringerle a farlo nei prossimi mesi e anni, in particolare in California, come riportato da TechCrunch.
E potrebbe trattarsi di una vera e propria urgenza. Secondo uno studio di Europol, entro il 2026 ben il 90% dei contenuti su Internet potrebbe essere generato dall’intelligenza artificiale. Un dato assolutamente sconvolgente, che mette a rischio la nostra capacità, come utenti di Internet, di verificare la veridicità delle informazioni che raccogliamo qua e là sul web.
Resta da vedere chi, tra Google e OpenAI, che da alcuni anni sta lavorando a uno strumento simile a SynthID Text, riuscirà a imporre il proprio standard per quanto riguarda la questione dei filigrani.
Fonte: www.frandroid.com
Adam Breeden/ZDNET.
Molti chatbot IA sembrano ancora artificiali, perché le interazioni somigliano più a semplici sessioni di domande e risposte che a conversazioni coinvolgenti. Tuttavia, alcuni sviluppatori di IA hanno lanciato versioni più interattive che simulano uno scambio autentico, come se si parlasse con un’altra persona. Gemini Live è uno di questi servizi.
Ora disponibile gratuitamente per tutti gli utenti Android, Gemini Live consente di intrattenere una conversazione più naturale con l’IA Gemini di Google, simile alla modalità ChatPlus Advanced Voice di OpenAI e a Copilot Voice di Microsoft.
È possibile intervenire in qualsiasi momento, interrompere l’assistente mentre parla, visualizzare le trascrizioni delle conversazioni e utilizzare l’IA in background o dalla schermata di blocco. Google offre anche una varietà di voci tra cui scegliere per personalizzare e migliorare le conversazioni.
Attualmente, Gemini Live è disponibile solo tramite l’app Gemini per Android. Questo significa che non è possibile utilizzarlo sul sito web di Gemini, nei messaggi Google o nella schermata di Gemini dell’app Google per iPhone e iPad.
Per utilizzare Gemini Live, è necessario uno smartphone o un tablet Android, l’app mobile Gemini o Gemini come assistente mobile, un account Google personale e conoscere una delle 40 lingue supportate. Dopo aver scaricato l’app da Google Play, basta cliccare sulla piccola icona a forma di onda in basso a destra. Ora è possibile iniziare una conversazione semplicemente salutando l’assistente.
Ecco sette consigli per ottenere il massimo da Gemini Live.
-
Scegli un argomento di conversazione interattivo
Come con qualsiasi chatbot IA, è possibile porre una domanda o chiedere informazioni su ciò che ti interessa. Tuttavia, per sfruttare appieno Gemini Live, è importante trattarlo come un vero interlocutore e non come un semplice robot di domande e risposte. Parlagli di argomenti aperti e l’IA potrà farti domande per portare avanti la conversazione. Consideralo un “amico” a cui chiedere aiuto, consigli o informazioni.
Ecco alcuni tipi di conversazioni suggeriti da Google:
- un brainstorming a voce alta, ad esempio chiedendo idee per un regalo, organizzare un evento o sviluppare un business plan;
- un’esplorazione approfondita, chiedendo ulteriori dettagli su argomenti che ti interessano;
- un allenamento a voce alta, ripetendo le conversazioni in modo più naturale.

Cattura schermo di Lance Whitney/ZDNET.
-
Interruzione di Gemini Live
Se l’IA sta parlando di qualcosa e desideri cambiare argomento, porre una domanda o fare un commento, puoi semplicemente interromperla! Per assicurarti che questa funzione sia attivata, vai alla schermata principale della chat. Tocca l’icona del tuo profilo in alto a destra e seleziona Impostazioni. Nella schermata delle impostazioni, attiva l’opzione Interrompi risposte di Live.

Cattura schermo di Lance Whitney/ZDNET.
La prossima volta che sarai nel bel mezzo di una conversazione e l’IA starà parlando, inizia a parlare. Poni una domanda o fai un commento. Gemini Live rileverà che hai interrotto la conversazione e ti risponderà. L’ho provato più volte: ogni volta, l’IA ha smesso di parlare dopo circa un secondo e ha orientato la conversazione verso il nuovo argomento che avevo scelto.

Cattura schermo di Lance Whitney/ZDNET
-
Pausa o interruzione della conversazione
Se desideri fare una pausa nella conversazione in corso, basta toccare il pulsante Pausa. Quando sei pronto per riprendere, premi Continua. Per fermare completamente la conversazione, premi Termina. A quel punto, puoi iniziare una nuova conversazione quando vuoi.

Cattura schermo di Lance Whitney/ZDNET
-
Vedere le trascrizioni delle tue conversazioni
Durante la conversazione in corso, Gemini Live non può visualizzare nulla sullo schermo. Pertanto, non puoi chiedergli di mostrarti testo, immagini o altri elementi. Tuttavia, la tua conversazione viene trascritta. Per visualizzare il testo di una conversazione, basta accedere alla cronologia di Gemini e selezionare la conversazione che desideri vedere. Puoi persino riprendere la conversazione.
Ad esempio, ho chiesto a Gemini Live di darmi una ricetta per una torta di noci pecan. Ha iniziato a elencare gli ingredienti senza mostrarli sullo schermo. Ma quando ho consultato la chat successivamente, tutte le istruzioni e gli ingredienti erano visibili, così ho potuto leggerli e seguirli!


Cattura schermo di Lance Whitney/ZDNET
Per utilizzare l’IA in background, avvia una sessione Gemini Live e esci dall’app. Fai scorrere verso il basso la parte superiore dello schermo e dovresti vedere un avviso che indica che sei in modalità Live con Gemini. Ora puoi continuare a chattare con Gemini Live mentre svolgi altre attività sul tuo telefono. Per tornare alla modalità a schermo intero, scorri verso il basso dalla parte superiore dello schermo e premi sul pannello Live con Gemini.


Cattura schermo di Lance Whitney/ZDNET
Per utilizzare l’IA sulla schermata di blocco, devi prima avviare la tua chat sulla schermata Gemini Live. Quando sei pronto, premi il pulsante di accensione del tuo dispositivo per passare alla modalità schermata di blocco. Continua la conversazione. Per tornare alla modalità a schermo intero di Gemini Live, scorri verso il basso e premi sul pannello “Live with Gemini”.


Cattura schermo di Lance Whitney/ZDNET
Fonte: “ZDNet.com”


Kerry Wan/ZDNET
A maggio, Google ha svelato Gemini Live, un assistente conversazionale alimentato dall’IA che può essere interrotto e riprendere le conversazioni più volte. Dalla sua introduzione, Gemini Live è stato disponibile solo per gli utenti di Gemini Advanced, i quali devono pagare un abbonamento mensile di 22 € per accedervi.
Questa settimana Google ha annunciato che tutti gli utenti dell’app mobile Gemini in inglese su Android possono ora accedere a Gemini Live, il che consente loro di avere conversazioni fluide con l’assistente quando lo desiderano. Non esiste un’app Gemini per iOS e, di conseguenza, questi utenti non potranno usufruire dell’esperienza.
L’aggiornamento rende l’accesso a Gemini Live completamente gratuito per gli utenti Android. Non dovranno più sborsare denaro per un abbonamento premium per accedervi, e il download dell’app dal Google Play Store è gratuito.
Modalità vocali in arrivo
Questo è particolarmente degno di nota poiché la funzione equivalente di ChatPlus, la nuova Modalità Vocale, è attualmente in fase di rilascio in alpha per un piccolo gruppo di utenti di ChatPlus Plus. Anche ChatPlus Plus richiede un abbonamento mensile di 20 dollari, e anche se hai già pagato, non c’è alcuna garanzia che tu faccia parte del gruppo di utenti che avranno accesso alla modalità vocale nel prossimo futuro.
Alla fine, sia Gemini Live che la modalità vocale di OpenAI potranno utilizzare la fotocamera dello smartphone per fornire all’assistente vocale il contesto dell’ambiente, così da migliorare le risposte.
Tuttavia, nessuna delle due aziende ha fornito una data precisa per il lancio della componente visiva della funzionalità.
Come sapere se hai accesso a Gemini Live?
Per sapere se hai accesso a Gemini Live:
- Assicurati che la tua app Gemini sia aggiornata e aprila come faresti normalmente.
- Se vedi l’icona della forma d’onda in basso a sinistra dello schermo dell’app, significa che hai accesso a Gemini Live.
- Una volta cliccato su questa icona, otterrai una descrizione dell’uso di questa funzione.
Se sei un utente Apple e soffri di FOMO (quella sensazione di perderti qualcosa), non preoccuparti. A maggio, Apple ha presentato Apple Intelligence, le sue funzioni di intelligenza artificiale che saranno integrate nell’esperienza dei dispositivi Apple, e una delle nuove funzioni è un Siri più intelligente.
Apple Intelligence farà parte di iOS 18, che è stato lanciato. Tuttavia, solo gli utenti con il chip A17 o successivi, quindi i possessori di iPhone 15 Pro e modelli successivi, potranno usufruire completamente di Apple Intelligence. Alcune delle nuove funzionalità di Apple Intelligence saranno rilasciate a ottobre, altre seguiranno in una data successiva.
Ma per gli utenti italiani, ci vorrà ancora un po’ di tempo.
Source : “ZDNet.com”

Google crea sorpresa rendendo gratuita una delle funzionalità di punta della sua intelligenza artificiale. Con Gemini Live, potrai conversare in modo naturale e vocale con l’IA di Google.

Presentato in grande stile durante la conferenza “Made by Google”, Google ha svelato Gemini Live, una versione avanzata del suo chatbot con cui è possibile conversare vocalmente. Inizialmente disponibile solo tramite abbonamento, oggi il team di Mountain View ha deciso di renderlo gratuito per tutti gli utenti Android.
Cos’è Gemini?
Gemini Live ha suscitato grande interesse durante la sua presentazione. Le intelligenze artificiali stanno già iniziando a occupare un posto rilevante nelle nostre vite quotidiane, soprattutto per l’uso testuale basato su comandi e risposte predefinite. Con Gemini Live, Google ha voluto competere con ChatPlus e il suo noto “mode vocale”.
L’intelligenza artificiale di Google è in grado di mantenere una conversazione fluida con l’utente. Potrai fare domande, interrompere la risposta per fornire ulteriori dettagli o cambiare argomento. L’obiettivo è creare un’esperienza di conversazione più naturale rispetto a quella tradizionale con gli strumenti AI attuali.
In passato, l’accesso a Gemini Live era possibile solo tramite l’abbonamento a Gemini Advanced, disponibile al costo di 21,99 euro al mese. Ora, tutti gli utenti Android possono usufruire di questa funzionalità gratuitamente. Per attivarlo, basta aprire l’app Gemini e cliccare sull’icona a forma di onda situata in basso a destra.
Lingua e disponibilità futura
Al momento, Google ha annunciato su X (ex Twitter) che Gemini Live è disponibile esclusivamente in inglese. Tuttavia, è una notizia positiva per coloro che desiderano testare questa intelligenza artificiale senza alcun costo, prima di decidere se sottoscrivere un abbonamento.
Non è ancora stata fornita alcuna informazione ufficiale sulla disponibilità in altre lingue, come il francese, né sull’eventuale rilascio per dispositivi iOS. Tuttavia, è probabile che Google espanderà presto il supporto a nuove lingue e piattaforme.
Conclusione
Gemini Live rappresenta un passo importante verso l’integrazione dell’intelligenza artificiale nelle conversazioni quotidiane. Offrire la possibilità di dialogare in modo più naturale e vocale con un’assistente AI, e farlo gratuitamente, segna un’evoluzione interessante nel panorama tecnologico. Restiamo in attesa delle prossime novità che Google potrebbe riservare per espandere ulteriormente le capacità e le funzioni di Gemini Live.
Fonte: www.smartworld.it


Pronti a tenere un po’ di IA nel palmo della mano?”
Durante la sua conferenza “Made by Google”, il gigante di Mountain View ha svelato la sua nuova gamma di dispositivi Pixel, con un ampio catalogo di smartphone: Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL e Pixel 9 Pro Fold 2. Questi telefoni di fascia alta (venduti da 899€ a 1899€) sono stati sviluppati con una potenza di calcolo sufficiente per far funzionare i modelli di intelligenza artificiale Gemini senza ricorrere a server esterni.
Ma non solo: ci sono anche i nuovi smartwatch Pixel Watch 3 e Pixel Watch XL, senza dimenticare gli auricolari wireless Pixel Buds Pro 2. Oltre al design degli smartphone, che richiama gli iPhone, e all’aggiornamento dei componenti, tra cui il processore Tensor G4, Google ha puntato la sua strategia sui servizi offerti dal suo modello di Intelligenza Artificiale generativa, Gemini. Questi dispositivi premium sono progettati per sfruttare al meglio la potenza del software, in un momento in cui la competizione con ChatPlus di OpenAI si fa sempre più accesa, in attesa del lancio di Apple Intelligence sui prossimi iPhone.
Se avete seguito i Giochi Olimpici di Parigi 2024 in TV, probabilmente avrete notato la pubblicità che elogiava Gemini in ogni interruzione. Attivabile con la semplice pressione del pulsante di accensione, l’IA si trasforma in un assistente personale che conosce a fondo il dispositivo e le sue applicazioni. “Ciò che richiedeva ore ora richiederà solo pochi minuti”, ha promesso Rick Osterloh, il vicepresidente di Google responsabile dei dispositivi.
Leader da un decennio nella ricerca sull’IA, l’azienda di Sundar Pichai aveva già introdotto alcune funzionalità impressionanti, come “circondare per cercare”, che genera una ricerca visiva dopo aver circondato un elemento sullo schermo, o la scrittura automatica dei messaggi nell’app di SMS. Queste funzionalità sono ancora gratuite per ora. Tuttavia, offrendo un anno di abbonamento a Gemini Advanced con l’acquisto di un Pixel 9 Pro, Google sta incentivando i clienti a fare affidamento sulla sua IA nella vita quotidiana.
Priorità all’IA generativa sui Pixel
L’aggiornamento ad Android 15 rafforzerà l’IA generativa su tutti gli smartphone (Samsung, Xiaomi, Motorola…) con questo sistema operativo, ma i Pixel saranno i primi a beneficiare di nuove funzionalità come il filtro intelligente che protegge l’utente dalle truffe sempre più comuni. Ci saranno anche esclusive come Pixel Studios, un’app interna che funziona come Midjourney o DALL-E, permettendo di generare immagini a partire da un semplice prompt. Inoltre, la funzionalità Pixel Screenshots consentirà allo smartphone di utilizzare screenshot intelligenti per estrarre informazioni e creare liste o note per non dimenticare un dettaglio visto online. Basta toccare questo promemoria per ritrovare facilmente il sito, anche dopo diversi mesi.
Infine, Gemini può anche fornire un riassunto scritto di una chiamata grazie all’opzione “Call Notes”. Tutto viene memorizzato sul dispositivo per garantire la privacy, assicura Google. La questione della privacy dell’altra persona al telefono è un altro dibattito ancora aperto.
Google punta anche sull’IA per mantenere il suo status di leader nella fotografia da smartphone. Strumenti interessanti, come la gomma magica per cancellare un dettaglio indesiderato, esistono già da tre anni. La novità “Add me” (“Aggiungimi”) consente di aggiungere una persona a una foto anche dopo che è stata scattata. Basta scattare due foto e trasferire un soggetto da una all’altra, poiché l’IA fonde senza difficoltà le due immagini.
L’IA targata Google la troviamo anche nelle orecchie. Il chip Tensor A1 dei Pixel Buds Pro 2 (a partire da 249€) è stato progettato per eliminare i rumori ambientali e chiarire la voce di chi chiama, anche nel trambusto dei mezzi pubblici. Indipendentemente dal telefono utilizzato, la promessa di una chiamata cristallina è assicurata.
Infine, la Pixel Watch 3 (a partire da 399€) beneficia dei progressi dell’IA alimentata dai dati raccolti da Fitbit, lo specialista degli smartwatch acquisito a gennaio 2021. Questo dispositivo fornisce un “punteggio di fitness” che tiene conto del sonno, dell’attività fisica e della frequenza cardiaca per diventare un coach virtuale personale. L’unica cosa che non potrà fare per voi è indossare le scarpe da ginnastica.
Fonte: www.ilsole24ore.com
![]()
Secondo le informazioni raccolte dal sempre presente Mark Gurman, Apple potrebbe annunciare questo autunno i dettagli della sua collaborazione con Google su Gemini e il suo lancio su iOS 18. L’idea? Offrire agli utenti più scelte in termini di intelligenza artificiale.

Abbiamo discusso di recente, Apple dovrebbe proporre Google Gemini come alternativa a ChatPlus per servire come chatbot integrato su iOS 18. Tuttavia, non sappiamo ancora quali saranno i dettagli di questa integrazione e quando l’intelligenza artificiale di Google potrebbe essere introdotta nel sistema operativo mobile di Apple.
Un doppio interrogativo su cui Mark Gurman ci fornisce alcune informazioni. Attraverso la sua newsletter PowerOn, il giornalista di Bloomberg spiega che in termini di intelligenza artificiale, Apple avrebbe “almeno” un altro accordo da annunciare, quest’autunno, facendo riferimento a Google Gemini. Una pista che si allinea con le dichiarazioni fatte di recente da Craig Federighi, responsabile del software di Apple.
Dal canto suo, sempre Mark Gurman rivela che Apple avrebbe abbandonato il chatbot Llama di Meta, le cui prestazioni al momento sono considerate insufficienti.
OpenAI ChatPlus e Google Gemini presto a confronto sull’iPhone?
Ricordiamo che Google Gemini, che potremmo avere su iPhone dopo il lancio su larga scala di iOS 18, sarebbe offerto come opzione alternativa per gli utenti che preferiscono la soluzione di Google a quella di OpenAI, che probabilmente sarà attivata di default. Non è escluso che altri chatbot si integrino su iOS 18 man mano, per offrire più alternative agli utenti.
Vale la pena notare che queste diverse IA saranno proposte nell’ecosistema di Apple parallelamente ad Apple Intelligence, la piattaforma proprietaria del gigante di Cupertino, di cui purtroppo saremo privati in Europa. Almeno nel medio termine.
Secondo Mark Gurman, Apple potrebbe “eventualmente” limitare alcune funzionalità avanzate di Apple Intelligence, riservandole a un abbonamento a pagamento. Un modo per la società di creare una fonte di reddito aggiuntiva… anche se questa formula a pagamento non sarà attuale per molti mesi, il tempo per Apple di stabilirsi e per gli utenti di sviluppare una dipendenza sufficiente dal servizio.
Fonte: www.frandroid.com









