Google a prezentat Veo, un nou model avansat de generare video cu inteligență artificială, capabil să creeze videoclipuri HD din texte, imagini sau videoclipuri prompt. Anunțul a fost făcut în cadrul evenimentului Google I/O 2024, unde compania a dezvăluit că Veo poate genera videoclipuri de 1080p cu durata de peste un minut și poate edita videoclipuri pe baza instrucțiunilor scrise. Deși nu este încă disponibil pentru utilizare largă, Veo promite abilități de editare video avansate și menținerea consistenței vizuale între cadre.
Veo își bazează funcționalitățile pe modele anterioare de generare video dezvoltate de Google, precum Generative Query Network și DVD-GAN, îmbunătățind calitatea și eficiența prin folosirea unor descrieri video detaliate și reprezentări video latente comprimate. Aceasta înseamnă că Veo poate interpreta prompturile mai precis și produce secvențe video mai detaliate și stilizate, cum ar fi timelapse-uri sau cadre aeriene.
Un aspect remarcabil al lui Veo este suportul pentru comenzi de editare cinematografică. De exemplu, la primirea unui videoclip și a unei comenzi de editare, Veo poate adăuga elemente noi, cum ar fi caiace într-o secvență aeriană a unei coaste, creând un videoclip editat nou și îmbunătățit. Aceasta deschide noi posibilități pentru creatorii de conținut video și profesioniștii din domeniul filmului. Exemplele de videoclipuri create cu Veo includ un cowboy călărind un cal, o înregistrare rapidă pe o stradă suburbană, kebaburi prăjindu-se pe grătar, un timelapse cu deschiderea unei floare de soare și altele. Notabil este faptul că lipsesc reprezentările detaliate ale oamenilor, care istoric au fost dificil de generat de modelele AI fără deformări evidente.

În ciuda impresiei inițiale pozitive a demonstrațiilor, Google recunoaște că generarea de videoclipuri AI este dificilă și că menținerea consistenței vizuale poate fi o provocare. Modelele pot prezenta probleme cum ar fi fluctuații, sărituri sau modificări neașteptate ale obiectelor între cadre, ceea ce poate afecta experiența vizuală. Compania a încercat să atenueze aceste probleme folosind transformatori de difuzie latente de ultimă generație.
Veo va fi inițial accesibil unui grup select de creatori prin VideoFX, un nou instrument experimental disponibil pe site-ul Google AI Test Kitchen. Google plănuiește să integreze capacitățile lui Veo în YouTube Shorts și alte produse în viitor, marcând un pas important în evoluția tehnologiei de generare video. Videoclipurile create de Veo vor fi marcate cu SynthID pentru a indica sursa AI și vor trece prin filtre de siguranță pentru a minimiza riscurile legate de confidențialitate, drepturi de autor și părtinire.
Sursa: arstechnica.com
