Vi kommer ikke udenom, at Artificial Intelligence i den grad har taget verdenen med storm og har cementeret sig selv som en del af vores fælles fremtid.
Personligt er jeg ret begejstret for de mange AI muligheder, der efterhånden er blevet en integreret del af vores hverdag.
Blandt disse finder man ChatGPT, som med dens jævnlige opdateringer og udvidelser eksempelvis er blevet en essentiel del af manges arbejdsliv.
I dette indlæg skal det handle om en af disse udvidelser; nærmere bestemt ChatGPT Sora – AI modellen, der efter sigende kan generere videoer ud fra tekst.
Sæt dig til rette i instruktørsædet
I februar måned kunne AI virksomheden OpenAI (dem, der også står bag ChatGPT) løfte sløret for en ny udvidelse af deres populære AI sprogmodel.
Der er her tale om en AI model, der skal kunne generere videoklip og -elementer ud fra tekstbaserede prompts.
Ideen er baseret på det samme princip, som vi har set for billedkreation ved hjælp af AI-modeller for eksempel hos Midjourney5 og Adobe Photoshop FireFly AI, der via tekstbaserede beskrivelser kan skabe eller tilrette de billeder, du ønsker.
Fra simpel prompt til realistiske videoer
Lige så vel som ChatGPT har forudsætningerne for at give meningsfulde svar på et hav af forskellige spørgsmål, lige så vel vil Sora ifølge Open AI have forudsætningerne for at skabe realistiske videoer ud fra vidt forskellige prompts.
Sora vil her være udstyret med en baggrundsviden omkring reelle detaljer i landskabet, realistiske bevægelser i forhold til det omkringliggende miljø, forskellige kameraindstillinger, videoformater og meget mere.
Jeg må helt ærligt indrømme, at jeg er imponeret over denne indsats fra Open AI og kan ikke vente med selv at teste det af, når Sora endeligt bliver lanceret.
Sora er stadig i test fasen
Open AI har siden nyheden om ChatGPT Sora i februar være gennemsigtige omkring processen. Der var nemlig ikke tale om en decideret lancering tilbage i februar, da Sora stadig var i udviklingsfasen.
I stedet kunne Open AI informere om, at de arbejdede tæt sammen med eksperter inden for sikkerhed, der skal sikre modellen mod fejlagtigt at producere indhold, der strider imod Open AI’s retningslinjer.
Derudover arbejder virksomheden tæt sammen med designere og videokreatører internt såvel som eksternt for at opnå værdifuld feedback til den videre udvikling.
AI har automatiseret en masse opgaver allerede. Læs mere om, hvordan AI anvendes i kundeservice her.
Brugernes involvering – en del af Open AI’s DNA
Da Sora stadig er i testfasen, er Open AI ikke blege for at indrømme, at der indtil videre stadig er fejl at finde i det videoresultat, der kommer fra de tekstbaserede prompts.
For eksempel kan der være fejl i særligt komplekse prompts, der kræver præcise detaljer i kameraindstillinger, større sceneopsætninger der strækker sig over tid etc.
Når Sora først bliver lanceret, vil man naturligvis kunne forvente, at mange af disse fejl vil være korrigeret, men med så mange andre af Open AI’s modeller vil der være tale om en udviklingsproces selv efter lanceringen, så snart at den almene bruger får lov til at teste modellen af.
Dette indgår i mine øjne som en naturlig del af Open AI’s DNA; at der skal være plads til, at den brede befolkning kan give sit besyv med at finjustere de modeller og programmer, som virksomheden lancerer.
15 års tips og tricks?
På LinkedIn deler jeg hver uge tips og tricks med mere end 8.000 følgere. Det er gratis at følge med og du kan altid “unfollow” mig igen. Vil du være med?
Kommentarer