I ricercatori di Google hanno recentemente svelato Lumiere, un nuovo modello di intelligenza artificiale per la generazione di video che raggiunge un realismo e un controllo creativo senza precedenti.
Ciò che distingue Lumiere è la presenza di una un’architettura denominata “Space-Time U-Net” capace di generare l’intera durata temporale dei video in una volta sola, attraverso un unico passaggio. Il vantaggio rispetto agli altri modelli che creano fotogrammi chiave distanti tra loro, seguiti da una super-risoluzione temporale, è evidente. Ciò permette infatti di mantenere un alto livello di coerenza all’interno del video, ed evitare la scattosità osservata in altre soluzioni analoghe.
Può eseguire la generazione di video da testo, e farlo usando stili diversi a seconda dei prompt impartiti. Può anche convertire immagini statiche in video, come nel caso de “La Ragazza con l’orecchino di perla” di Vermeer, che potete vedere a metà di questa pagina. Più delle nostre parole, però, può il video che trovate qui sotto, che mostra le peculiarità di Lumiere.
La proposta di Google pare dunque aprire le porte a infinite possibilità nel mondo dell’intrattenimento, della pubblicità e oltre. L’era della generazione di video realistici grazie all’IA è solo all’inizio e Lumiere potrebbe non essere l’unica sorpresa di quest’anno in un settore in continua evoluzione.


