TáTO ANIMOVANá MONA LISA BOLA VYTVORENá AI A JE TO DESIVé

Send

Záhadný, maľovaný úsmev „Mona Lisa“ je známy po celom svete, ale táto slávna tvár nedávno vystavila prekvapujúcu novú škálu prejavov, ktoré boli poskytnuté pomocou umelej inteligencie (AI).

Vo videu zdieľanom na YouTube 21. mája tri videoklipy ukazujú znepokojujúce príklady Mony Lisy, keď pohne perami a otočí hlavu. Bola vytvorená konvolučnou neurónovou sieťou - typom AI, ktorý spracováva informácie podobne ako ľudský mozog, analyzuje a spracúva obrázky.

Vedci vyškolili algoritmus na pochopenie všeobecných tvarov rysov tváre a na to, ako sa správajú k sebe navzájom, a na to, aby tieto informácie použili na statické obrázky. Výsledkom bola realistická videosekvencia nových výrazov tváre z jedného snímky.

Pre videá Mona Lisa AI „naučila“ tvárové hnutie z dátových súborov troch ľudských predmetov, pričom vytvorila tri veľmi odlišné animácie. Zatiaľ čo každý z týchto troch klipov bol stále rozpoznateľný ako Mona Lisa, variácie vzhľadu a správania tréningových modelov požičiavali „osobným portrétom“ odlišné „osobnosti“, Egor Zakharov, inžinier s Skolkovo ústavom vedy a techniky, a Centrum Samsung AI Center (obe sa nachádzajú v Moskve), vysvetlené vo videu.

Zakharov a jeho kolegovia tiež generovali animácie z fotografií kultúrnych ikon 20. storočia, ako sú Albert Einstein, Marilyn Monroe a Salvador Dalí. Vedci opísali svoje zistenia, ktoré neboli recenzované, v štúdii uverejnenej online 20. mája v predtlačovom časopise arXiv.

Známe tváre nadobúdajú neznáme prejavy. (Obrazový kredit: E. Zakharov a kol.)

Produkcia originálnych videí, ako sú tieto, známe ako deepfakes, nie je ľahká. Ľudské hlavy sú geometricky zložité a vysoko dynamické; Autori štúdie napísali 3D modely hláv „desiatky miliónov parametrov“.

Podľa štúdie je systém ľudského videnia veľmi dobrý v identifikácii „dokonca drobných chýb“ v trojrozmerných ľudských hlavách. Vidieť niečo, čo vyzerá takmer ľudsky - ale nie úplne -, vyvoláva pocit hlbokého nevoľníctva známeho ako záhadný efekt údolia.

Al už predtým preukázal, že je možné dosiahnuť presvedčivé hlboké chvenie, ale vyžaduje viac uhlov požadovaného subjektu. Pri novej štúdii predstavili inžinieri umelú inteligenciu pre veľmi veľký súbor údajov referenčných videí ukazujúcich ľudské tváre v akcii. Vedci vytvorili orientačné body tváre, ktoré by sa vzťahovali na každú tvár, aby učili neurónovú sieť, ako sa tváre správajú všeobecne.

Potom vyškolili inteligenciu na použitie referenčných výrazov na mapovanie pohybu prvkov zdroja. Vedci tvrdili, že to umožnilo umelej inteligencii vytvoriť hlbokú tvár, aj keď mala iba jeden obraz.

A viac zdrojových obrázkov prinieslo ešte podrobnejší výsledok vo výslednej animácii. Vedci napísali videá vytvorené z 32 obrázkov, nie iba z jedného, v používateľskej štúdii dosiahli „dokonalý realizmus“.

Send