AI imee suloisten kissan valokuvien tekemisen, kaipaa selvästi Internetin koko pistettä

Pin
Send
Share
Send

Keinotekoinen älykkyys (AI) yritti äskettäin tuottaa kissan valokuvia tyhjästä, ja tulokset olivat kissan astrofisia.

Tämä erityinen hermoverkko (tyyppi AI, joka on mallinnettu ihmisen aivojen toiminnan jälkeen) voi tuottaa hämmästyttävän realistisia alkuperäiskuvia ihmisen kasvoista. Itse asiassa näiden katsottujen ihmisten kuvia oli melkein mahdotonta erottaa ihmisten valokuvista, AI: n ohjelmoijat ilmoittivat tutkimuksessa, joka lähetettiin joulukuussa 2018 esipainetulle päivälehdelle arXiv.

Felines kuitenkin osoittautui toiseksi tarinaksi. Sama algoritmi, joka tuotti virheetöntä ihmisen kasvoja, loi kissoja, joissa on vääryyspäät; väärä määrä silmiä ja jalkoja; ja rungot, jotka olivat liian pitkiä, liian lyhyitä, epätavallisen pyöreitä tai suorakulmaisia ​​ja taivutettuja erityisissä kulmissa.

Kammottavia kissan valokuvia tuottanut AI-moottori tunnetaan nimellä "tyylipohjainen generaattoriarkkitehtuuri generatiivisille vihollisverkoille" tai StyleGAN. Tämän tyyppiset verkot ovat "kilpailevia", koska kaksi mallia toimii samanaikaisesti: toinen tuottaa kuvia ja toinen arvioi tulokset harjoitustietojoukon valokuvien perusteella, jotta verkko oppii virheistään ja parantaa suorituskykyään, tutkimus totesi.

Jotta AI tuottaisi elinikäisiä ihmiskuvia, sen oli ensin "opittava" miltä ihmisen kasvot näyttivät olemassa olevista valokuvista. Algoritmi hajotti kasvot alas tyyliominaisuuksien, kuten pään asennon, tarkistusluetteloon; sukupuoli; ihonväri; hiusten rakenne ja tyyli; ja silmien, nenän ja suun muoto, tutkijat kertoivat.

Kun StyleGAN pystyi tunnistamaan kaikki nämä elementit - ilman ihmisen valvontaa -, se oppi koottamaan ne itsenäisesti tuottamaan upouuden, valokuvarealistisen ihmisen kasvot. Tutkijat hylkäsivät haastattelupyynnön, mutta selittivät prosessiaan videolla, joka lähetettiin Youtubeen 12. joulukuuta 2018.

Joten, miksi StyleGAN ei voinut luoda ihastuttavan realistisia kissojen valokuvia? Algoritmi teki parhaansa sen kanssa, minkä kanssa sen oli työskenneltävä - ja kun kyse oli kissoista, tuhannet referenssikuvat, joita se käytti, olivat vähemmän kuin ihanteellisia, kertoi Janelle Shane, tutkija, joka kouluttaa hermoverkkoja, mutta ei ollut mukana tutkimus, kertoi Live Science.

Shane kirjoitti omituisista kissoista 7. helmikuuta blogissaan AI Weirdness. Toisin kuin StyleGAN-valokuvien ihmisten kasvot - joissa ruumiit ja taustat oli rajattu pois ja pään asennot olivat samanlaiset toisiinsa -, tietokokonaisuuden kissankuvat vaihtelivat villisti. Kokoelma sisältää lähikuvia ja laajoja kuvia kissoista erilaisissa ympäristöissä ja erilaisiin taustaihin nähden. Joissakin valokuvissa oli yksi kissa, toisissa mukana useita kissoja, toisissa myös ihmisiä.

"On ylösalaisin kissoja; siellä on palloissa käpristyneitä kissoja; heidän silmänsä ovat auki; heidän silmänsä ovat kiinni. Voit varmasti kertoa, että heidän syöttötiedot ovat vähän meluisia - ja meluisilla tarkoitan, että siellä on juttuja se ei ole vain kuva kissasta ", Shane sanoi.

Joten, älä ole liian kova StyleGanilla sen kauhistuttavaan painajaisten kissien syömiseen.

"Algoritmin on opittava vielä paljon enemmän", Shane lisäsi.

Vaikka StyleGANin fotorealistiset ihmiset olivat virheetöntä, hermoverkko kamppaili kissan kokoamisen kanssa. (Kuvan luotto: Nvidia)

Ristiriitaiset visuaaliset ohjeet vaikeuttivat StyleGANia oppimaan, millaisen todellisen kissan piti näyttää. Ja hermostoverkoilla ei ole reaalimaailmaa niiden antamiin tietoihin; he tietävät vain, mitä heidän tietojoukkoissaan on. StyleGAN on oppinut viitekuvista tarpeeksi toistamaan tarkasti pienimuotoiset yksityiskohdat ja tekstuurit, kuten kissan turkiksen tai kissan korvan muodon. Mutta ohjelma kamppaili selvästi koko kissan kokoamiseksi, Shane sanoi.

"Neuraaliverkko ei ymmärrä kissojen toimintaa. Se ei ymmärrä kuinka monta jalkaa heillä on. Ei oikeastaan ​​ole selvää, kuinka monta silmää heillä tai mihin heidän koko anatomiansa menee", hän kertoi Live Science: lle.

Katso lisää StyleGANin häiritsevistä kissan valokuvista, lähes täydellisistä ihmiskuvista ja muista projektitiedostoista GitHub-kehitysalustalla.

Pin
Send
Share
Send