Evoluția rapidă a IA generativă a stârnit diverse discuții și subiecte. Încotro se îndreaptă relația dintre AI generativă și creativitate? Arai Mono, care este CTO al AIHUB și lucrează la intersecția dintre divertisment și tehnologie, și Seshita Hiroyuki, un regizor de animație cu o lungă carieră în 3DCG, discută viitorul acestei relații din perspectiva lor.

■Profil
Seshita Hiroyuki
Un regizor de animație aparținând Studioului KADAN. Născut în 1967, el a lucrat în diverse domenii ale producției CG și VFX încă din anii 1980. Seshita a regizat mai multe lucrări notabile, inclusiv „Knights of Sidonia”, „Ajin: Demi-Human”, „BLAME!” și trilogia „GODZILLA”. Cel mai recent proiect al său, „Lupin III vs. Cat’s Eye”, este acum disponibil pe Amazon Prime Video. În plus, Seshita a contribuit la conducerea personajelor CG în „Suzume” a lui Shinkai Makoto.

Arai Mono
Director reprezentativ și CTO al AIHUB Co., Ltd., unde lucrează și ca artist și inginer. El a fost implicat în numeroase startup-uri și proiecte, în primul rând în care divertismentul și tehnologia se intersectează, deținând roluri precum Manager de proiect, Manager de produs și Arhitect. Arai a jucat un rol în înființarea Asociației Japoniei Linux și a Asociației Medicale Japoneze a Organizației de Management ORCA „Proiectul ORCA”. De când a fondat AIHUB Co., Ltd., el s-a concentrat pe cercetare și dezvoltare, dezvoltarea cazurilor de utilizare, implementarea socială a AI generativă și fuziunea AI responsabilă și a tehnologiei web3. Este membru fondator al Anime Chain Initiative, care își propune să dezvolte un model de fundație curat pentru IA generativă.

■Mecanismul inteligenței artificiale și preocupărilor
–Director Seshita, cât timp a trecut de când te-ai aruncat în lumea 3DCG?

Seshita: În jurul anului 1987. Am participat la un proiect pentru Pavilionul Tujitsu la Expoziția Internațională de Grădină și Verdeață (desfășurată în 1990), printr-o introducere a profesorului meu de școală profesională, Douglas Lerner. A fost un job part-time într-un proiect condus de personalități notabile precum Dr. Nelson Max de la Lawrence Livermore National Laboratory și Roman Kroitor, co-fondatorul IMAX Corporation. Mai târziu, în 1989, m-am alăturat unei companii de producție CG numită Links, unde am ajuns să lucrez la Flora Dome (cogăzduit de Ministerul Poștelor și Telecomunicațiilor, NTT și KDD) la Expoziția Internațională de Grădină și Verdeață. M-am gândit „Iată-mă din nou!” (râde).

Arai: Înțeleg. La acea vreme, eram secretar privat pentru domnul Aikawa (Kiyoshi) de la Omnibus Japan. De asemenea, am primit mult sprijin de la Links (râde). În plus, am făcut parte dintr-o societate mixtă înființată de mai multe companii, precum Omnibus Japan și Links.

Seshita: Uau! Se pare că eram destul de aproape unul de celălalt.

Arai: Cu toate acestea, în cele din urmă m-am îndepărtat de 3DCG și am decis să urmăresc dezvoltarea utilizând sisteme de operare și software open-source. În prezent, lucrez la intersecția dintre divertisment și tehnologie, inclusiv AI.

Seshita: Îmi amintesc că a fost un boom AI și în anii 1980. La acea vreme, o stație de lucru numită Symbolics, care folosea LISP (un limbaj de nivel înalt folosit în cercetarea AI), era populară. Îmi amintesc că am fost uimit de simulările de mișcare a turmei. A fost o epocă cu multe idei progresiste, dar, deși teoriile erau fascinante, au existat multe limitări de mediu, cum ar fi specificațiile scăzute ale mașinii, care au avut nevoie de zeci de mii de ani de calcul pentru a fi practice (râde). De aceea sunt atât de încântat că IA a devenit atât de comună acum și văd diferitele discuții pozitiv, deoarece fac parte din procesul care aduce aplicațiile practice mai aproape..

Arai: Apariția transformatorului arhitectura în 2017 a marcat un punct de cotitură în dezvoltarea AI în ultimii ani. Aceasta este una dintre tehnicile de învățare profundă, care odată cu apariția sa a împărțit profund istoria AI în înainte și după crearea ei. În plus, dezvoltarea actuală a AI are ca fundal și comunitatea open-source, unde partajarea lucrărilor și implementarea funcțiilor se desfășoară într-un ritm incredibil de rapid, care este un alt factor care contribuie la dezvoltarea sa incredibil de rapidă. Ciclul de producție durează mult mai mult. Cercetătorii de la universități și companii ar scrie lucrări, care ar fi supuse unui proces de evaluare inter pares înainte de a fi publicate în reviste academice. Abia după aceea, produsele reale bazate pe cercetare ar fi dezvoltate.

În ziua de azi, lucrările sunt imediat încărcate online, iar în câteva zile sunt implementate pluginuri bazate pe acele lucrări. Este așa-numitul model „catedrală și bazar”. În dezvoltarea AI, lucruri noi se nasc într-un mediu plin de viață, asemănător unui bazar, în care magazinele individuale se adună în loc să finalizeze un proiect uriaș prin stivuirea pietrelor precum construirea unei catedrale.

De aceea se spune adesea că ceea ce este important pentru Inovația AI creează un mediu în care diverși oameni talentați se pot implica cu ea. Pe acest fundal, au apărut descoperiri inovatoare, cum ar fi tehnica „imbinare ierarhică” și extensia „ControlNet”.

Seshita: În lumea 3DCG, Blender își face, cu siguranță, prezența cunoscută ca o zonă deschisă proeminentă. software-ul sursă. Diferite idei sunt în mod constant realizate și acumulate, stimulându-se reciproc și dând naștere unor idei noi. Beneficiile comunității open-source sunt pe deplin utilizate, ceea ce face ca aceasta să devină o forță dominantă în industrie..

Revenind la AI, există o știre care mi-a atras atenția recent. Autorul romanului care a câștigat premiul Akutagawa („Tokyoto Dojo-to” al lui Kudan Rie lit. Tokyo Metropolitan Sympathy Tower) a menționat că au folosit AI (parțial). Mă întreb de ce au simțit nevoia să dezvăluie aceste informații. De exemplu, oricât de performante ar fi un procesor de text sau un creion, toate sunt doar instrumente pentru creativitate, nu? AI este, de asemenea, unul dintre aceste instrumente, așa că m-am gândit că nu trebuie să-l menționeze în mod specific.

Arai: AI este într-adevăr un nou „pen” pe care creatorii îl pot folosi. Cu toate acestea, cred că mulți oameni sunt îngrijorați cu privire la utilizarea AI în lume, deoarece nu pot spune din exterior dacă acel stilou este cu adevărat sigur și de încredere.

Seshita: Eu personal vreau să folosesc AI în se formează în viitor și am început să experimentez diverse lucruri. Cu toate acestea, când mă uit la discuțiile despre AI, sunt mai îngrijorat că aranjamentele legale și morala operațională care o înconjoară se vor muta într-o direcție care creează un număr mare de noi reglementări și constrângeri, ducând în cele din urmă la o scădere a creativității generale. a comunității, mai degrabă decât AI în sine.

■ Relația dintre generatorii de imagini AI și anime
— În discuțiile despre generatoarele de imagini AI, cred că oamenii sunt îngrijorați că AI este antrenat cu imagini pe internetul fără permisiunea creatorilor. Ați putea explica din nou ce presupune procesul de antrenament al IA generativă?

Arai: Procesul de formare al generatoarelor de imagini AI poate fi împărțit aproximativ în trei etape. Primul este antrenamentul modelului de fundație. Aici, AI este antrenat cu informații de bază, cum ar fi modul în care funcționează lumea și conceptele umane. Generatorii de imagini AI sunt instruiți cu aproximativ 5 miliarde de imagini pe internet. Apoi, sub forma unui antrenament suplimentar, IA este alimentată cu informații mai specifice, cum ar fi stiluri anime sau stiluri fotorealiste, care este îmbinată cu modelul de bază.

În procesul final, numit antrenament focalizat, AI-ul sunt date date care pot servi drept referință pentru elementele vizuale specifice dorite. Articolul 30-4 din Legea privind drepturile de autor permite utilizarea imaginilor cel puțin pentru formare de bază și suplimentară, atâta timp cât este „utilizare care nu este destinată să se bucure de idei sau sentimente exprimate în materialul protejat prin drepturi de autor”. Pe de altă parte, când vine vorba de utilizarea rezultatelor generate, indiferent dacă generatorul este AI sau uman, acesta este judecat pe baza „asemănării” și „încrederii”. Dacă acești doi factori sunt prezenți, este recunoscut drept încălcare a drepturilor de autor.

— Modelele fundației sunt antrenate cu 5 miliarde de imagini?

Arai: Pentru a fi mai precis, mai degrabă decât crearea unui set de date pentru formare, datele sunt aproximativ adunate, iar imaginile problematice, cum ar fi pornografia infantilă, sunt excluse mecanic, dar acest lucru nu se face prin confirmarea vizuală a fiecărei imagini.

Seshita: În cazul unei dezbateri despre indiferent dacă o imagine generată de o inteligență artificială este „similară sau nu”, ar face oamenii de fapt această judecată? Chiar și atunci când oamenii desenează, există diverse posibilități. Ar putea fi plagiat, omagiu sau chiar parodie. Este un proces dificil de a ajunge la o concluzie.

Am unele îngrijorări că, dacă societatea se mișcă într-o direcție în care imaginile care au chiar și cel mai mic sentiment de similitudine sunt considerate drept încălcări ale drepturilor de autor, aceasta poate restricționa activitățile creative. Acest lucru m-a făcut să cred că va fi nevoie de o IA pentru a evalua încrederea și similitudinea imaginilor generate de AI, precum și standardele internaționale, în viitor. Dacă există un sigiliu de aprobare care spune: „Este gata, ” oamenii pot profita de asta cu încredere.

Arai: Modelele de bază ale generatoarelor actuale de imagini AI sunt antrenate într-un mod care nu poate șterge astfel de preocupări. De fapt, ceea ce lucrăm pentru a clarifica această problemă este dezvoltarea unui „generator de imagini AI cu un model de bază antrenat exclusiv cu date autorizate” (Anime Chain Initiative „Anime Chain FAQ”). Să dovedești că „nu a fost folosit AI” este o sarcină extrem de provocatoare, deoarece este o dovadă a diavolului, dar este posibil să dovedești „folosirea AI sigură”.

Seshita: Deci, vine timpul în care vom face și noi să demonstrăm cum se face anime-ul, ca să spunem așa, „originea și materiile prime folosite pentru a-l crea.”

Arai: Cred că trebuie să adoptăm această abordare pentru a limita răspândirea generatoarelor de imagini AI care exploatează limba japoneză. anime și ilustrații pentru fundația și formarea lor suplimentară.

Seshita: E ca și cum mâncarea spune că sunt făcute din agricultură ecologică sau că nu folosesc culturi modificate (râde).

Arai: Așa este (râde).

Seshita: Cu toate acestea, în cazul anime-ului, este un efort colectiv al unui personal de 100 până la 300 de oameni. A avea o înregistrare pentru fiecare ieșire și înregistrarea fiind capabilă să demonstreze că „este folosit AI sigur” ar putea fi destul de supărător. Tehnologia blockchain poate ajuta, dar sunt îngrijorat că munca în afara procesului creativ va deveni o povară.

Arai: În loc să-i pun pe lucrători să o facă, cred că poate fi făcută într-un mod care face un record la nivel de aplicație și dispozitiv.

Seshita: De ceva vreme mă gândesc să folosesc tehnologia blockchain pentru a reduce munca generală de birou a creatorilor. Dacă poate fi conectat la nivel de aplicație și dispozitiv, cred că poate fi aplicat pentru „autoritatea înregistrării”. Când utilizați IA generativă, posibilitatea de a oferi dovezi ale originilor și o înregistrare a procesului de producție va deveni un punct de vânzare al produsului.

Arai: Așa este. Cred că, dacă se obține permisiunea de a folosi imaginile pentru instruire, o parte din profit poate fi returnată deținătorilor de drepturi chiar și pentru utilizarea rezultatelor generate.

— Mai devreme, ați menționat că 5 miliarde de imagini sunt utilizate pentru antrenarea modelului de fundație. Veți avea nevoie de cât mai multe imagini autorizate?

Arai: Conform ultimelor lucrări, rezultate similare pot fi obținute chiar și cu 20 până la 30 de milioane de imagini, reducând timpul de antrenament la o zecime. De asemenea, a existat o tendință ca modelul de bază pentru IA generativă să fie antrenat pentru a reflecta estetica occidentală. Este ca și diferența de aromă atunci când folosiți diferite tipuri de bulion.

Seshita: Bulion? (râde)

Arai: Da (râde). Modelele actuale sunt nevoite să genereze rezultate care se potrivesc gusturilor japoneze. Este întotdeauna mai bine să ai valori diverse decât să ai o singură cultură dominantă. O IA generativă adaptată conținutului japonez va obține rezultate mai bune în generarea de conținut japonez. În plus, cred că acolo poate ajuta AI la răspândirea creativității japoneze.

Seshita: Dintr-o perspectivă diferită, este uimitor că ar putea duce și la utilizarea AI pentru a proteja cultura japoneză. Ascultându-te, se pare că utilizarea practică a IA generativă este mult mai aproape decât mi-am imaginat și sunt încântat. Îmi doresc foarte mult să vină ziua în care pot folosi AI ca propriul meu asistent. Unul care nu spune „Nu pot să răspund la asta” când îi cer „Fă ceva în privința termenului” (râde).

Arai: (râde)

Seshita: Îmi cer scuze pentru că conversația s-a transformat în SF, dar asta a fost imaginea mea ideală despre AI de multă vreme. Nu trebuie să fie instrucțiuni directe, ci posibilitatea de a avea conversații abstracte și a avea ca rezultat sfaturi sau inspirație. Ar fi o relație creativă frumoasă cu AI.

Categories: Anime News