Lo sfogo

Piccoli e grandi sfoghi personali sulle sventure che mi capitano

Archivio per Ottobre, 2025

Ott
31

Gemini mi impressiona

Categoria Internet, Pensieri

Ho sempre utilizzato l’assistente di Google anche prima dell’avvento dell’intelligenza artificiale infilata in ogni dove. L’utilizzo principale è sempre stato durante la guida dello scooter, sul casco da anni (sono già al secondo dispositivo) ho un Interphone collegato via Bluetooth al cellulare, comodo per rispondere e fare telefonate durante la guida senza dovermi fermare ogni 5 minuti e guadagnare tempo (mi capita spesso che mi venga in mente qualcosa da dire a qualche cliente, ufficio o familiare).

Il primo ed embrionale assistente di Google era veramente limitato e limitante, un po’ perchè spesso non capiva cosa gli si diceva e perchè serviva usare una terminologia molto precisa per fargli fare un qualcosa. Ricordo gli insulti perchè non faceva partire una chiamata o recuperava un numero online ignorando quello in rubrica, oppure smetteva di ascoltare a caso o quando doveva attendere una mia conferma.

Poi l’intelligenza artificiale è arrivata prepotentemente (direi supportata da un buon marketing) e Google ha dato vita a Gemini, ammetto di aver installato manualmente l’APK appena disponibile non aspettando il rollout ufficiale e già dai primi momenti ho notato i miglioramenti apportati. Con il tempo ovviamente Gemini è cresciuto e ha imparato a fare molte molte cose e oggi mi accompagna con soddisfazione.

Ogni tanto provo a fare alcune cose rimanendo stupito che Gemini esegua il comando senza eccessivi problemi se non chiedere di sbloccare il telefono (preferirei una qualche impostazione che disattivi totalmente l’obbligo di sbloccare lo schermo ma per ora si aspetta).

La prima prova è stato chiedere a Gemini di avviare un podcast su Spotify mettendo in play l’ultima puntata disponibile e, sblocco a parte, il podcast è andato in play senza intoppi. Uso in maniera abbastanza continuativa l’aggiunta di appuntamenti in calendario o far partire telefonate, inoltre scrivo abbastanza spesso messaggi WhatsApp (anche se alle volte forse per il rumore del traffico commette degli errori di trascrizione delle parole).

Da relativamente poco, se non sono stati visualizzati i messaggi si può dire a Gemini di leggere le notifiche e con mia sorpresa se i messaggi sono lunghi (come testo) fa autonomamente un riassunto leggendolo a voce chiedendo alla fine se si vuole leggere il messaggio originario o rispondere.

Ultime due funzioni provate e correttamente eseguite sono state di avviare la navigazione di Maps prendendo l’indirizzo dall’agenda (l’indirizzo era indicato nel titolo e non come destinazione vera a propria) e come per magia c’è riuscito, aspettando solo che toccassi la mappa per far partire la navigazione.

Altra funzione testata è stata quella di salvare un contatto partendo da una mail ricevuta.

Utilizzando una mail sul mio dominio Aruba (quello del lavoro non quello del blog) Gemini ha tentato di recuperare i dati dalla mail non riuscendoci (credo che da Gmail riuscirebbe) ma usando Cerchia e Cerca ho solo selezionato la parte della mail interessata e gli ho detto di salvare il contatto con quei dati e anche in questo caso bingo!

Ultima cosa che mi ha colpito, quando gli si detta un messaggio, oltre che trascriverlo a schermo (ma non sempre posso leggere) terminata la dettatura viene letto a voce prima dell’invio, se si nota un errore o si vuole apportare modifiche basta spiegargli cosa deve fare e dove inserire la modifica e il più delle volte il messaggio viene corretto.

Certo si deve controllare cosa Gemini fa e i dati/testi che trascrive, inoltre sarebbe bello che non smettesse di ascoltare se si fa una pausa mentre si usa una cuffia (non so se sia la cuffia o Gemini), però ammetto che mi semplifica non poco la vita mentre sono in mezzo al traffico in sella allo scooter.

Provando le varie AI quella di Google sia onestamente un passo avanti e le skill implementate sono molte e potergli spiegare le cose senza termini precisi è pratico ed alla portata di tutti, gli altri fanno molto marketing affermando di essere avanti ma non so quanto sia vero (basta vedere il browser di OpenAI che funziona ma commette anche molti errori durante l’utilizzo con AI).