OpenAI je predstavio Soru, njihov najnoviji AI model za generiranje videa, dizajniran za oživljavanje tekstualnih uputa u fotorealističnim videozapisima duljine do jedne minute. Sora se ističe u izradi zamršenih scena s više likova, specifičnim pokretima i preciznim detaljima subjekata i pozadine, pokazujući razumijevanje objekata u fizičkom svijetu i sposobnost tumačenja rekvizita dok stvara izražajne likove.
na snazi od utorka
Vlada objavila nove cijene goriva
Problem s opskrbom
FOTO "Nema dizela ni benzina": Neke pumpe već bez goriva, ministar se pravi Englez
"vrlo dobri i produktivni razgovori"
Novi preokret! Trump odgodio udare nakon razgovora s Iranom, ali druga strana tvrdi da nije to pravi razlog
Prema OpenAI-u, Sora može generirati videozapise na temelju fotografija, popuniti okvire koji nedostaju u postojećim videozapisima ili produljiti njihovo trajanje. Iako se model povremeno može boriti sa simulacijom fizike složenih scena, rezultati su nedvojbeno impresivni. Značajne demo snimke sadržavale su scene poput pogleda iz zraka na Kaliforniju tijekom zlatne groznice i simulirane perspektive iz tokijskog vlaka, prikazujući time Sorine sposobnosti.
Za razliku od svojih prethodnika, kao što je Midjourney, koji se fokusirao na generiranje teksta u sliku, polje AI generiranih videa se brzo razvilo, s modelima generiranja videa kao što su Runway, Pika i Googleov Lumiere. Lumiere, konkurent Sori, također nudi mogućnosti pretvaranja teksta u video tee omogućuje korisnicima i stvaranje videozapisa iz fotografija.
Trenutno dostupna "crvenim timovima" koji procjenjuju potencijalne rizike i štete, Sora je također dostupna vizualnim umjetnicima, dizajnerima i filmašima za povratne informacije. OpenAI prepoznaje potencijalne izazove, uključujući ograničenja modela u preciznoj simulaciji složenih scena i tumačenju određenih uzročno-posljedičnih instanci.
Pročitajte i ovo
Kruže glasine
Napad na Google: OpenAI ima planove za razvoj tražilice
Pročitajte i ovo
Borba protiv lažnog saadržaja
OpenAI uvodi vodene žigove na slike napravljene njihovim DALL-E 3 generatorom slika
OpenAI je nedavno najavio i dodavanje vodenih žigova svojem AI alatu za pretvaranje teksta u sliku, DALL-E 3, uz upozorenje da se ti vodeni žigovi mogu lako ukloniti. Kao i kod drugih proizvoda umjetne inteligencije, OpenAI je svjestan implikacija lažnih fotorealističnih videozapisa generiranih umjetnom inteligencijom koji se pogrešno smatraju pravim sadržajem, naglašavajući potrebu za odgovornom upotrebom i razmatranjem mogućih posljedica.
Izvor: The Verge