ChatGPT'yi geliştiren OpenAI şirketi metin formatındaki prompt'lara yani istemlere göre gerçekçi videolar oluşturabilen yapay zeka uygulaması Sora'yı tanıttı.
Sora kullanıcılar tarafından verilen yönergeleri takip ederek, 1 dakika uzunluğunda videolar oluşturabiliyor. Uygulama gerçekçi görüntülerden animasyona farklı formatlarda videolar üretebiliyor. Ayrıca farklı kamera açılarının bir arada kullanıldığı karmaşık görüntüler oluşturabiliyor. Sora, metinden video oluşturmanın yanı sıra sabit bir görüntüdeki öğeleri hareketlendirerek videoya dönüştürebiliyor.
Sora'da yayılım modeli ve dönüşüm mimarisi olarak isimlendirilen yapay zeka teknolojilerini kullanıyor. Yayılım modeli, OpenAI'ın metinden görsel üreten DALL-E uygulamasının da dayandığı model. Yayılım modelleri, rastgele piksellerin adım adım iyileştirilerek anlamlı görüntülere dönüştürülmesini sağlayacak şekilde eğitiliyor. Dönüşüm mimarisi ise sıralı verilerin işlenmesinde kullanılan bir model. OpenAI tarafından geliştirilen CHatGPT ya da Google DeepMind tarafından geliştirilen Gemini gibi büyük dil modellerinden kullanılan bu yapı kelimelerin anlamlı cümleler oluşturacak şekilde sıralnmasını sağlıyor.
Sora'da ise araştırmalar yama adı verdikleri küçük görüntü parçalarından bağlama uygun videolar oluşturmak için dönüşüm mimarisini kullandı.