Hranice toho, čo dokáže umelá inteligencia, sa každým dňom posúvajú. Spoločnosť OpenAI predstavila svoj model Sora, ktorý dokáže generovať videá na základe textového vstupu. Sora sa tak v portfóliu spoločnosti zaradil k obľúbeným službám Chat-GPT (tvorí text) a Dall-E (tvorí obrázky).
Z hľadiska používateľa funguje Sora veľmi podobne ako dva vyššie spomenuté modely. Stačí slovne opísať vec, ktorú chceme, aby program vygeneroval, a potom si chvíľu počkať na výsledok. Model Sora zatiaľ nie je dostupný širokej verejnosti.
Mocný nástroj
Podľa OpenAI Sora dokáže vygenerovať videá dlhé až jednu minútu. Je schopný prechádzať niekoľkými strihmi, počas čoho udržiava konzistenciu scény a vizuálneho štýlu. Jeho (relatívne) silnou stránkou je spracovanie fyzikálnych vlastností objektov a ich vzájomných interakcií.
Je zbytočné podrobne rozpisovať, ako Sora funguje z technického hľadiska. Za model najlepšie hovoria jeho výsledky. Rovnaký prístup zvolil CEO spoločnosti OpenAI Sam Altman, a preto na sociálnej sieti X (predtým Twitter) ľudí vyzval, nech mu napíšu veci, ktoré by chceli vidieť. Výsledky sú takéto:
Pokračovanie článku nájdeš na ďalšej strane