Hihetetlen, de az OpenAI új videóiban egyetlen valós képkocka sincs

Hihetetlen, de az OpenAI új videóiban egyetlen valós képkocka sincs
2024. 02. 21., 13:10

A ChatGPT-vel nagyot robbantó vállalat legújabb fejlesztése a Sora, egy olyan mesterséges intelligencia modell, ami minden korábbinál valósághűbb videókat generál, csupán a bevitt szöveg alapján.

Az elmúlt napok legforróbb AI témáját ismét a ChatGPT-t alkotó OpenAI szolgáltatta, ezúttal viszont nem a nyelvi modell újabb fejlesztésével, hanem egy teljesen új mesterséges intelligencia bejelentésével. A Sora névre keresztelt text-to-video AI egyperces kisfilmeket hoz létre, de olyan vizualitással, mintha azt egy profi stáb forgatta volna, valós helyszínen. Az egyelőre csak tesztelők szűk köre számára elérhető AI alkalmazással az OpenAI azt a célt tűzte ki, hogy megtanítsa a gépnek a fizikai világ megértését, majd e szerinti szimulálását.

Az amerikai vállalat közölte: a Sorát nem csak a benne rejlő kockázatokat felmérő tesztelők, hanem olyan szakemberek számára is rendelkezésre bocsátotta, akik vizuális művészként és tervezőként vagy filmkészítőként adnak visszajelzést, majd tesznek javaslatot az AI fejlesztésének további irányára. Fontos, hogy ők is részt vegyenek az előzetes vizsgálatban, mert a videó generáló újdonság a jövőben pont a kreatív szakembereket célozza meg.

„Idejekorán megosztjuk a kutatásunkat OpenAI-n kívüli emberekkel, hogy visszajelzést kérjünk tőlük, illetve bemutassuk a nyilvánosságnak, hogy milyen mesterséges intelligencia képességek vannak láthatáron” - írja az OpenAI. A közleményük alapján a Sora képes összetett jeleneteket generálni több szereplővel, meghatározott típusú mozgásokkal, valamint a téma és a háttér pontos részleteivel. A modell nemcsak azt érti meg, hogy a felhasználó mit kért a promptban (bevitt leírásban), hanem azt is, hogy ezek a dolgok hogyan léteznek a fizikai valóság szintjén. „A modell mélyen érti a nyelvet, így képes pontosan értelmezni az utasításokat, és lenyűgöző, élénk érzelmeket kifejező karaktereket generálni. A Sora egyetlen generált videón belül több felvételt is képes létrehozni, amelyek pontosan követik a karaktereket és a vizuális stílust.”

Az OpenAI szerint még nem tökéletes a Sora

A Sorának egyelőre megvannak a maga gyengeségei is - vallja be az OpenAI, arra utalva, hogy a modell nehezen tudja pontosan szimulálni egy összetett jelenet fizikáját, és nem érti az ok-okozati összefüggések konkrét eseteit. Példaként kiemelik: „egy személy [a videóban] beleharaphat egy sütibe, de utána a sütin nem biztos, hogy látszik a harapásnyom”. Mint írják, a modell összekeverheti a felszólítás térbeli részleteit is (pl. bal vagy jobb oldal), és nehézségekbe ütközhet az időben lezajló események pontos leírásával kapcsolatban, mondjuk egy adott kamerapálya követésével.

A világ, és különösen az AI-fejlesztésben konkurens Kína egyszerre figyeli csodálattal és aggodalommal az OpenAI legújabb innovációját. A shenzheni genomikai óriásvállalat vezérigazgatója, Yin Ye például „az AI-fejlesztés newtoni pillanatának” nevezi a Sorát, mivel az már képes összekapcsolni a fizika törvényeit a digitális valósággal. A South China Morning Post idézi a játékfejlesztő és -kiadó Kunlun Tech vezetőjét, Fang Hant is, aki már kicsit szkeptikusabb a technológiával kapcsolatban. Mint mondta: a Sora demó videói nem győzték meg arról, hogy a valóság megértésében nagy áttörést értek volna el. Igaza lehet, tekintve, hogy a közzétett kisfilmeken gondos takarásban (pl. napszemüveg mögé rejtve) maradnak az emberi tekintetek, amelyek, ha láthatóvá tennék őket, sokat ronthatnának a fotorealisztikus illúzión, és ha jobban megnézzük, az utcán sétáló lány talpa alatt bizony „csúszik” a talaj. Ettől függetlenül persze lenyűgöző, hogy ebben a videóban egyetlen valós képkocka sincs:

 

Az OpenAI leszögezte: a Sora fejlesztésével egyidőben rengeteg biztonsági intézkedést alkalmaznak. Együtt dolgoznak például egy ún. „vörös csapattal”, akik a félretájékoztatás, a gyűlöletkeltő tartalom és az elfogultság szakértői. Egyelőre náluk pattog a labda, hogy ellentmondásos promptokkal tárják fel a Sora gyengeségeit. Közben építenek eszközöket a félrevezető tartalmak felismerésére, amelyek kiszűrik, mi készült Sorával és mi nem. Ez rendkívül fontos lesz a közeljövőben, hiszen az új generatív AI-val készült felvételek jelentős részéről – hacsak nem valami abszurd dolog szerepel rajtuk – már most is nehéz megállapítani, hogy nem egy profi videós csapat, hanem egy mesterséges intelligencia készítette, csupán néhány sor szövegből. Félelmetes, de tényleg.

Gábor János

Főoldali kép: OpenAI

Ha tetszett a cikk, kövesse az ÜZLETEMET
a Facebookon!

Még több friss hír

2025. 01. 17., 10:10
A január 15-én lezárult Napenergia Plusz Program december–januári „véghajrájában” közel 750 támogatási kérelem érkezett be, az egy éves benyújtási időszak alatt pedig összesen több mint 23 ezer pályázó igényelt összesen 96,4 milliárd forint állami hozzájárulást modern napelemes rendszerek telepítéséhez – tájékoztatott az Energiaügyi Minisztérium.
2025-01-17 15:44:35
A SALT Budapest alapvető filozófiája a hagyományos magyar konyha újragondolása. Tóth Szilárd séf és csapata olyan régi recepteket és technikákat elevenít fel, amelyek évtizedekkel, sőt évszázadokkal ezelőtt jellemezték a magyar vidéki konyhát.

  BIZNISZPLUSZ PODCAST

2025. 01. 17., 08:20
epizód: 2025 / 2   |   hossz: 24:49
A kiskorú gyermeket nevelő szülők adóalapját csökkentő családi kedvezmény mértéke 2025. július 1-jétől 50 százalékkal nő, így a kétgyerekes családok az év második felében már nem havi 40 ezer, hanem 60 ezer forint adót és járulékot takarítanak meg. Nem mindegy azonban, hogy mikor és hogyan nyilatkoznak erről a dolgozók, miközben a munkáltatóknak is érdemes odafigyelni az ezzel kapcsolatos változásokra. A legfontosabb tudnivalókról Honyek Pétert, a PwC Magyarország személyi jövedelemadóval foglalkozó területének igazgatóját kérdeztük.
Az amerikai vállalat éppen Budapesten nyitott irodát, hogy a magyar fővárosból kiindulva Európában és Ázsiában is terjessze a forradalmi alumínium-újrahasznosító technológiáját. Az Austin AI Europe a kontinens klímacéljai felé lökdösi mindazokat a gyártókat, akik nem csak a szén-dioxid-kibocsátást, hanem a költségeket is visszafognák – közvetlenül hulladékból származó, azonnal feldolgozható alumínium újrahasznosításával. A részben vagy egészben a timföldgyártást is kiváltó megoldást a cég hazai munkatársai, Demmer Dóra és Cholnoky Miklós mutatták be a BizniszPlusznak. Ismerje meg közelebbről a fenntartható alumíniumgyártás úttörő rendszerét, amely Magyarországról folytatja útját a világhír felé!
2024. 12. 17., 10:35
epizód: 2024 / 24   |   hossz: 27:58
A 2025-ös évre vonatkozó adócsomag változásai minden vállalkozást érintenek, és komoly átalakulás küszöbén állnak a NAV digitális megoldásai is, amelyekben már szerepet kap a mesterséges intelligencia. Farkas Gábor, a PwC Magyarország adó- és jogi tanácsadási üzletágának vezetője részletesen beszélt a BizniszPlusznak az adórendszert érintő új szabályokról, az áfabevallások digitális jövőjéről és az adótanácsadás fejlődési irányairól. Ezek a nagyvállalatok és a kkv-k mellett a könyvelői és adótanácsadói szakmára is hatással lesznek, érdemes tehát meghallgatni a szakértő értékelését és tanácsait.

  Rovathírek: GUSTO

A SALT Budapest alapvető filozófiája a hagyományos magyar konyha újragondolása. Tóth Szilárd séf és csapata olyan régi recepteket és technikákat elevenít fel, amelyek évtizedekkel, sőt évszázadokkal ezelőtt jellemezték a magyar vidéki konyhát.

  Rovathírek: ATOMBUSINESS