Novità nel settore dell’Intelligenza Artificiale (IA), questa soluzione non teme paragoni. Un nome nuovo da valutare.
L’Intelligenza Artificiale (IA) sta trovando sempre più strada in una serie di settori produttivi dalla sanità alle comunicazioni, dalla gestione dei trasporti alla finanza, per fare degli esempi. Dunque lo spazio che questa tecnologia trova nella società è sempre maggiore con effetti considerevoli, a cominciare dal lavoro.

A livello pubblico e di enti privati lo sviluppo di soluzioni di IA sempre più sofisticate con impieghi nuovi è in continua crescita, con progressi che ormai sono all’ordine del giorno. A dare contributi decisivi non sono esclusivamente i giganti del settore come Google, con Gemini, o Open Ai con ChatGPT. Aziende come Sesame stanno sviluppando prodotti con risultati impressionanti.
Una soluzione di IA incredibile, con risultati sbalorditivi
Sesame è un’azienda specializzata nello sviluppo di assistenti vocali basati sull’intelligenza artificiale. In particolare un modello denominato Conversational Speech Model (CSM) sta dando risultati incredibili con voci di assistenti vocali virtuali così naturali e realistiche da essere quasi del tutto indistinguibili da una umana.

Generalmente il tono delle voci create da intelligenza artificiale risulta piatto e monotono, con una scarsa capacità espressiva. Questo dipende dai limiti nella comprensione delle sfumatura di significato delle parole dell’interlocutore umano, sia dalla ristrettezza nelle variazioni possibili dei toni della voce del sistema artificiale. Il sistema introdotto da Sesame si pone l’obiettivo di superare il problema.
Le indicazioni sono a più livelli. Intanto una comprensione maggiore del contesto della conversazione e quindi un adattamento del tono vocale alla situazione. Poi un uso più attento di pause e interruzioni nella conversazione, per produrre un dialogo più fluido e naturale. Infine una capacità più estesa di riprodurre emozioni e sfumature vocali, rendendo così la voce più naturale ed espressiva.
La risposta dell’IA di Sesame è quindi più emotiva, comprendendo non solo il contenuto della conversazione ma anche il tono. Al momento il sistema con CSM è solo in inglese e le voci denominate Maya o Miles non parlano altre lingue in maniera fluente. In futuro però Sesame punta a introdurre nuove lingue nel sistema, ampliando le possibilità. Bisogna aggiungere però il livello di conoscenza del sistema sviluppato da Sesame è inferiore a Gemini o ChatGPT.
Il suo obiettivo infatti è sviluppare una capacità espressiva naturale e contestualizzata. Cosa non condivisa da altri sistemi di IA, anche più efficienti. Questo perché lo sviluppo di modelli con CSM richiede molte risorse, soprattutto durante l’addestramento, per la memoria e l’utilizzo dei dati.
Poi va considerata che tono ed espressività non possono essere valutati in modo oggettivo e le performance richiedono valutazioni non standardizzate. Comunque CSM è già un risultato straordinario che senza dubbio crescrerà in futuro.