Společnost OpenAI představila nový model umělé inteligence Sora, který dokáže vytvářet videa na základě textových promptů. Zatím umí jen minutu dlouhá videa a není k dispozici veřejnosti. Výkonný ředitel OpenAI Sam Altman požádal na sociálních sítích na náměty a vygeneroval řadu videí, které svými detaily berou dech. „Tento model nebudeme v brzké době rozšiřovat do svých produktů,“ oznámil mluvčí OpenAI.
Společnost, se svým populárním chatbotem ChatGPT a obrázkovým generátorem DALL-E, je jednou z několika technologických startupů, které vévodí v revoluci generativní umělé inteligence, která se odhalila veřejnosti na sklonku roku 2022. V blogovém příspěvku napsala OpenAI, že Sora dokáže generovat s přesností různé postavy a různé typy pohybu. Nicméně se může potýkat s obtížemi při zachycování fyzikálních nebo prostorových detailů složitější scény, což může vést k tomu, že vygeneruje něco nelogického, deformuje subjekt nepřirozeným způsobem nebo nechá znenadání zmizet, uvedla OpenAI.
Přesto však videa sdílená OpenAI ukazují hyperrealistické detaily, které by mohly znesnadnit běžným internetovým uživatelům rozlišení AI-generovaného videa od skutečného záběru. Například záběry z fiktivní zoo na želvu či ženu jdoucí po ulici vypadají velmi dobře. Zlatí retrívři, kteří dělají podcast na úpatí hory, také nemají chybu. Kromě níže uvedených videí se můžete pokochat záběry ze Sory na oficiálních stránkách.
1) What https://t.co/w6b9T1WWue
— Sam Altman (@sama) February 15, 2024
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
https://t.co/rPqToLo6J3 pic.twitter.com/nPPH2bP6IZ
— Sam Altman (@sama) February 15, 2024