Tekoäly Glide tuotti vasemman yläkulman kuvan seuraavasta tekstistä: ”Surrealistinen ja unenomainen öljymaalaus, joka on kuin Salvador Dalin työ ja jossa kissa pelaa tammea.” Kuva: OpenAi
Tekoäly Glide tuotti vasemman yläkulman kuvan seuraavasta tekstistä: ”Surrealistinen ja unenomainen öljymaalaus, joka on kuin Salvador Dalin työ ja jossa kissa pelaa tammea.” Kuva: OpenAi

Oppiva hermoverkko tuottaa kuvan muutamasta sanasta ja muutamista pikseleistä.

Tekoälyjä tuottava OpenAI-yhtiö julkisti vuosi sitten ohjelmiston, joka tuotti kuvia tekstien perusteella.

Ohjelma loi kuvan esimerkiksi sanoista ”avokadon muotoinen nojatuoli”.

Nyt sama yhtiö julkaisee tekoälyn, joka tuottaa vielä tarkempia kuvia entistä nopeammin ja halvemmalla. Ohjelma noudattaa yhä tarkemmin kuvan sanallisia kuvauksia.

Sisältö jatkuu mainoksen jälkeen

Tekoäly on saanut nimekseen Glide. Se luo kuvan 15 sekunnissa. Siihen on ohjelmoitu ”vain” 3,5 miljardia muuttujaa.

Sisältö jatkuu mainoksen alla

Edellinen sanoista kuvia tuottava tekoälyn malli vuodelta 2021 oli nimeltään Dall-e. Se sisälsi peräti 12 miljardia erilaista muuttujaa.

Vanha malli opetteli kuvien tekemistä käymällä läpi eri kuvasarjoja vaikkapa koirista, taloista ja autoista.

Uusi malli lähestyy kuvien tuottamista hieman eri tavalla.

Sen oppivaa hermoverkkoa koulutetaan yhä tarjoamalla paljon kuvia. Samalla näytetyt kuvat kuitenkin tuhotaan tekoälyn seuratessa.

Kuvaan tehdään kohinakerros, joka heikentää kuvan laatua. Käytännössä kuva sotketaan asteittain, ja se tuhotaan pikseli pikseliltä. Lopputulos on puhdas kaaos.

Tekoäly on oppiva hermoverkko, joka oppii siitä, miten kaaos tuotetaan. Samalla se voi kuitenkin oppia tekemään myös päinvastoin.

Se voi tuottaa järkevän oloisen kuvan oppimansa perusteella. Kuvan alku on muutamissa pikseleissä.

Tekoäly alkaa työstää kuvaa syötteellä, jossa on vain kohinaa. Siitä syntyy fotorealistinen kuva, joka vastaa mahdollisimman hyvin tekstin kuvausta.

OpenAI:n tutkijat sanovat, että Gliden avulla käyttäjä voi pyytää luomaan kuvan esimerkiksi ”viihtyisästä olohuoneesta”.

Sitten käyttäjä saattaa pyytää lisää: ”Näytä tarkemmin tuo maalaus koirista, joka on sohvan yläpuolella”.

Vuorovaikutteisen tietotekniikan tutkija, professori Mark Riedl Georgian teknillisestä instituutista uskoo, että tällaiset sovellukset tulevat osaksi valokuvien muokkausta.

Kuvankäsittelyohjelma Photoshopista voi tulla hermoverkkomainen, arvioi Riedl New Scientist -lehdessä.

Kokeissa ihmiset laitettiin seuraamaan ja vertailemaan Gliden ja Dall-e:n tuottamia kuvia. Gliden kuvat tuntuivat realistisemmilta.

Open AI:n tutkijat esittelivät Gliden tutkijoiden käyttämässä arXiv-ennakkojulkaisupalvelussa. Artikkelia ei ole vertaisarvioitu.

JeeSe
Seuraa 
Viestejä2476

Olisi ihan mielenkiintoista nähdä millainen taideteos tulisi, kun tekoälylle antaisi sanat täältä palstalta.

Epäilykseni on, että lopputulema olisi telkkarin "lumisadetta" muistuttava kuva. Ei informaatiota.

Tauko
Seuraa 
Viestejä3248

Deimos kirjoitti:
ID10T kirjoitti:
Tekoälyn sijaan pitäisi tässä tapauksessa puhua mielestäni tekomielikuvituksesta tai tekoluovuudesta.

Kyseessä on kuitenkin jokin alkeellinen neuroverkko (Esiaste). Saa nähdä mitä tapahtuu kun tuo kehittyy. Sama taitaa päteä kirjallisuuteen. Kumpikohan olisi vaikeampi? Kuvataide vai kirjallisuus?

Kuvataiteen ja kirjalisuuden lisäksi musiikin puolella on AI tulollaan. Ja liittyyhän kirjallisuus myös musiikkiin lyriikoineen.

Tällaisen löysin nettihaulla:

"Jukebox
https://openai.com/blog/jukebox/

Curated Samples
Provided with genre, artist, and lyrics as input, Jukebox outputs a new music sample produced from scratch. Below, we show some of our favorite samples"

Eli sisältää myös kuunneltavia musanäytteitä eri tyyleillä.

Tuosta musiikin generointitekniikasta ja problematiikasta ja tuon Jukeboxin tasosta en osaa sanoa.
Toivottavasti löytyisi aihetta paremmin osaavia kommentoimaan.
Ainakin deep purposen alaa.

Sisältö jatkuu mainoksen alla