La capacità dell’intelligenza artificiale di generare contenuti originali si estende sempre più oltre il testo e le immagini, arrivando ora al suono.
Nvidia, leader mondiale nella fornitura di chip e software per sistemi AI, ha svelato Fugatto, un innovativo modello di intelligenza artificiale progettato per creare musica, modificare voci e generare suoni mai sentiti prima.
La tecnologia è pensata per rivoluzionare l’industria dell’intrattenimento, dai produttori di film e videogiochi fino ai musicisti.
Cosa rende unico Fugatto
Fugatto, abbreviazione di Foundational Generative Audio Transformer Opus 1, non è semplicemente un modello in grado di generare suoni partendo da una descrizione testuale. La sua unicità risiede nella capacità di elaborare e trasformare audio già esistente.
Con Fugatto, un brano suonato al pianoforte può essere trasformato in una melodia vocale umana, oppure una registrazione parlata può cambiare accento e tonalità emotiva.
Tra le possibilità offerte, Nvidia ha mostrato anche la generazione di suoni completamente nuovi, come una tromba che abbaia come un cane, spingendo i confini della creatività musicale e sonora.
“Se pensiamo a come l’audio sintetico ha trasformato la musica negli ultimi 50 anni, grazie a computer e sintetizzatori, è evidente che l’intelligenza artificiale generativa porterà ulteriori innovazioni nel settore,” ha dichiarato Bryan Catanzaro, vicepresidente della ricerca sull’apprendimento profondo applicato di Nvidia.
L’AI e il dibattito etico
Nonostante il potenziale dirompente di Fugatto, Nvidia ha dichiarato di non avere ancora piani per un rilascio pubblico della tecnologia. “Qualsiasi tecnologia generativa comporta rischi, poiché potrebbe essere usata per scopi impropri,” ha spiegato Catanzaro, sottolineando la necessità di un approccio cauto.
Il modello è stato addestrato utilizzando dati open source, una scelta che Nvidia difende per evitare controversie sul copyright, un tema che si sta facendo sempre più spinoso.
Nei mesi scorsi, ad esempio, l’attrice Scarlett Johansson ha accusato OpenAI di imitare la sua voce senza autorizzazione, evidenziando le tensioni tra il mondo della tecnologia e l’industria dell’intrattenimento.
La difficoltà di regolamentare l’uso di queste tecnologie rimane comunque uno degli ostacoli principali.
Oltre al rischio di violazioni di copyright, c’è la possibilità di abusi come la creazione di contenuti ingannevoli o falsi, un problema che i creatori di modelli AI stanno cercando di affrontare senza ancora trovare soluzioni definitive.
Una rivoluzione per creativi e sviluppatori
Fugatto si inserisce in un panorama in cui la competizione si fa serrata.
Start-up come Runway e colossi come Meta Platforms stanno già lavorando a tecnologie simili per la generazione di audio e video, ma Nvidia si distingue per la profondità e versatilità del suo approccio.
Il futuro di Fugatto è ancora incerto ma una cosa è chiara: se Nvidia riuscirà a trovare un equilibrio tra innovazione e responsabilità, la sua tecnologia potrebbe cambiare per sempre il modo in cui creiamo e il suono.


