Ce este Sora, noul model de generare video lansat de OpenAI

Ce este Sora, noul model de generare video lansat de OpenAI

Google a anunţat recent că întrerupe funcţia de generare a imaginilor de inteligenţă artificială a chatbot-ului Gemini din cauză că acesta oferă imagini cu personaje istorice „inexacte”. În timp ce gigantul american se confruntă cu această problema, startup-ul Open AI, care este susținut de Microsoft, a lansat un nou model AI generativ, care a fost denumit Sora. Ce este, la ce folosește și cine are acces la acest instrument de inteligență artificială îți vom spune în cele ce urmează.

Ce este inteligența artificială

Termenul de inteligență artificială (AI) se referă la capacitatea sistemelor sau mașinilor de a imita cât mai fidel anumite funcții umane, cum ar fi raționamentul, învățarea, planificarea și creativitatea, potrivit Europarl.Europa.eu. AI permite sistemelor tehnice să perceapă mediul în care funcționează, să prelucreze această percepție pentru a rezolva anumite probleme și pentru a atinge diverse obiective. Calculatorul primește datele deja pregătite sau colectate prin intermediul propriilor senzori, cum ar fi o cameră video, le prelucrează și reacționează. Sistemele AI sunt capabile să-și adapteze, într-o anumită măsură, comportamentul, analizând efectele acțiunilor anterioare și funcționând autonom.

De câte tipuri este inteligența artificială

Sistemele de inteligență artificială se adaptează, analizează date, prevăd acțiuni viitoare pe baza informațiilor existente și funcționează în mod autonom. Inteligența artificială dispune de un sistem de funcționare similar omului, ceea ce face să învețe lucruri noi, să le aplice și să se adapteze în funcție de condițiile din jur. AI este de două tipuri, și anume software și încorporată. Inteligența artificial de tip software include asistenți virtuali, motoare de căutare, sisteme de recunoaștere facială și vocală, precum și anumite programe informatice de analiză a imaginilor. De partea cealaltă, inteligența artificială încorporată include roboți, drone, mașini autonome și internetul obiectelor.

Cum funcționează inteligența artificială

În zilele noastre, inteligența artificială este cu mult mai importantă comparativ cu momentul în care a apărut, în urmă cu mai bine de jumătate de secol. In zilele noastre, puterea de calcul a crescut exponential, exista cantitati enorme de date, iar algoritmii au dus la progrese majore in inteligenta artificiala a ultimilor ani.  În ceea ce privește modul de funcționare al inteligenței artificiale există mai multe elemente-cheie, iar unul dintre acestea îl reprezintă viziunea computațională. Aceasta constă în înțelegerea imaginilor și folosește o serie de tehnici de învățare profundă și, totodată, în identificarea tiparelor pentru a putea înțelege imaginile, inclusiv grafice, tabele, imagini existente în documente PDF, texte și video.

Ce este OpenAI

OpenAI este o companie de cercetare și implementare a inteligenței artificiale înființată în 2015, care în urmă cu doi ani a lansat chatbot-ul ChatGPT. Aceasta își propune să dezvolte AI și să o facă un instrument benefic pentru toți oamenii. Domeniile de cercetare ale OpenAI includ învățarea automată, robotica și inteligența artificială, iar potențialul ca aceste tehnologii să modeleze viitorul AI este imens.  OpenAI pune accentul pe cercetarea și dezvoltarea AI și a instrumentelor de învățare automată pentru diverse activități, iar printre produsele sale se numără ChatGPT, DALL-E 2, Codex și Whisper. În prezent, Microsoft este unul dintre cei mai mari acționari și susținători ai OpenAI. Unul dintre co-fondatori, celebrul Elon Musk, a părăsit corabia în 2018, iar în iulie 2023 a înființat propria sa companie de inteligență artificială, denumită xAI, potrivit Coursera.

Ce este modelul generativ Sora

Noul model de inteligență artificială „text-to-video” (n.n. – text-în-imagine) dezvoltat de OpenAI este un software capabil să genereze videoclipuri cu o durată de până la un minut. Denumirea noului model AI generativ provine de la cuvântul nipon „sora” (n.n. – 空 în limba japoneză), care în traducere liberă înseamnă „cer”. Acest cuvânt este destinat utilizării de către artiști vizuali, designeri și regizori, fiind de altfel și testat de toți aceștia. Scopul este acela de a oferi feedback asupra modelului, după cum precizează reprezentanții companiei de peste Ocean.

Sora le permite utilizatorilor să creeze filmulețe care conțin scene realiste și pline de imaginație folosind anumite indicații pe care chiar ei le scriu, păstrând în același timp calitatea vizuală, relatează The Verge. Compania de peste Ocean notează, de asemenea, că modelul de inteligență artificială poate să „înțeleagă” modul în care obiectele există în lumea fizică, dar și să interpreteze cu acuratețe recuzita și să genereze personaje convingătoare care exprimă emoții puternice.

Ce poți face cu Sora

Software-ul generativ Sora este capabil să creeze scene complexe cu mai multe personaje, tipuri specifice de mișcare, precum și o serie de detalii foarte precise ale subiectului și fundalului, așa cum se precizează pe blogul OpenAI. Compania observă, de asemenea, că modelul poate înțelege modul în care obiectele „există în lumea fizică”, precum și „interpreta cu acuratețe elementele de recuzită și generează personaje convingătoare care exprimă emoții vibrante”. Dincolo de faptul că poate genera videoclipuri pornind de la indicațiile text ale utilizatorilor, Sora poate anima și o imagine fixă, după cum se menționează într-o postare pe blogul companiei. De asemenea, modelul poate să genereze un videoclip pe baza unei imagini statice, dar și să completeze cadrele care lipsesc dintr-un videoclip existent ori să-l extindă.

Domeniile de aplicabilitate ale Sora

Noul model generativ Sora de la OpenAI promite să redefinească unele industrii prin capacitatea sa de a transforma procesele de creație video. Cu o abordare rapidă și accesibilă, Sora oferă noi oportunități în domeniul producției de conținut video de înaltă calitate, oferind posibilități nelimitate în multe domenii. Spre exemplu, în industria filmului, Sora aduce o nouă dimensiune în crearea de efecte speciale, animații și scene virtuale. În domeniul publicității, Sora oferă posibilitatea realizării unor reclame personalizate și captivante prin care să se transmită mesaje unice și relevante, atrăgând în acest fel atenția publicului într-un mod care până acum era greu de obținut. De asemenea, cu ajutorul Sora pot fi generate materiale video tematice interactive și atractive cu ajutorul cărora profesorii pot capta atenția elevilor. Nu în ultimul rând, în lumea artei, Sora ajută la generarea de opere de artă digitale unice și expresive, iar artiștii pot explora noi forme de expresie și pot da viață unor creații inovatoare.

Lumiere, principalul concurent pentru Sora

Demo-urile pe care Sora le-a generat și care au fost incluse în postarea de pe blogul OpenAI includ o scenă aeriană din California în timpul goanei după aur, un videoclip care pare să fi fost filmat din interiorul unui tren din Tokyo și altele. Multe dintre aceste filmulețe prezintă o serie de detalii revelatoare de inteligență artificială, așa cum este cazul unei podele care se mișcă nefiresc de mult într-un videoclip dintr-un muzeu, iar OpenAI spune că modelul „poate să prezinte o serie de probleme în a simula cu acuratețe fizica unei scene complexe”, însă rezultatele sunt în general destul de impresionante.

În urmă cu câțiva ani, generatoarele „text-to-images”, ca Midjourney, se aflau în fruntea abilității modelelor generative AI de a transforma cuvintele în imagini. În ultima vreme, însă, videoclipurile au început să se îmbunătățească într-un ritm remarcabil. Companii ca Runway și Pika au prezentat modele impresionante de text-în-imagine, în timp ce modelul generativ Lumiere de la Google pare să fie unul dintre principalii concurenți ai OpenAI și în acest spațiu. Similar cu Sora, Lumiere le oferă utilizatorilor săi instrumente de transformare a textului în video și le permite, totodată, să creeze videoclipuri pornind de la o imagine fixă.

Sora este în plin proces de dezvoltare

Noul software Sora urmează modelul chatbot-ului ChatGPT, care a creat vâlvă în jurul inteligenței artificiale generative datorită capacității sale de a compune e-mailuri și de a scrie coduri și poezii. Reprezentanții companiei recunosc faptul că, în unele situații, modelul AI poate să întâmpine ceva dificultăți în urmărirea unei anumite traiectorii a camerei video. De asemenea, compania a mai precizat și că dezvoltă o serie de instrumente pentru a putea determina în ce măsură un anumit videoclip a fost generat de Sora sau de o altă sursă. OpenAI a ținut să precizeze că Sora se află încă în curs de dezvoltare, motiv pentru care au dat publicității informații limitate despre noul lor produs. Totodată, americanii nu au dezvăluit nici imaginile și sursele video utilizate pentru a antrena Sora.

Pentru cine este disponibil Sora?

Oficialii companiei OpenAI au ținut să menționeze că noul lor instrument de inteligență artificială nu este încă disponibil publicului. În prezent, Sora este disponibil doar pentru așa-numitele „echipe roșii”, care evaluează modelul generativ cu scopul de a identifica potențialele prejudicii și riscuri pe care le prezintă acesta. În același timp, OpenAI oferă acces unor artiști vizuali, designeri și regizori pentru a obține un feedback. Asta pentru că cei de la OpenAI au observat că modelul existent ar putea să nu simuleze cu acuratețe fizica unei scene complexe și nici să nu interpreteze în mod corect anumite situații de cauză și efect. La fel cum se întâmplă în cazul celorlalte produse de inteligență artificială pe care le-a dezvoltat, OpenAI va trebui să se confrunte cu consecințele faptului că videoclipurile fotorealiste false, cu inteligență artificială, vor fi confundate cu cele reale.

Foto: Shutterstock

  

  

Leave a Reply

Your email address will not be published. Required fields are marked *