keskiviikko 6. maaliskuuta 2024

Sora ja videotuotannon mullistus

OpenAI esitteli 15.2.2024 hämmästyttäviä videoita, jotka Sora-niminen tekoäly oli tuottanut. Taivas on japaniksi sora ja se näyttää olevan tekoälyn luovuuden rajana. Toistaiseksi Sora on vasta pienen testijoukon käytettävissä, joten sen todellista toimivuutta on mahdoton arvioida. Jos demot vastaavat todellisuutta, vaikutukset ovat huimia. 

Googlen ja Facebookin videotyökalut ovat olleet alkeellisia, kuin mustavalkofilmille kuvatut mykkäfilmit 1900-luvun alussa. Niihin verrattuna Sora on kuin 4K-tason videokuva katsottuna hyvälaatuisesta, isokokoisesta OLED-televisiosta.

Olin viime viikolla kommentoimassa Soraa MTV:n Viiden jälkeen ohjelmassa. Piirrätin sitä varten kuvan Maikkarin uudesta Pöllölaaksosta. 

Maikkarin uusi Pöllölaakso tekoälyn silmin.

Ei näytä ihan samalta kuin Helsingin Vallilan toimistotalo, mutta tekoäly on ottanut hienosti huomioon antamani ohjeet. Aiemmin tekoäly kompuroi teksteissä, mutta tässä OWL ja Newsroom ovat lähes oikein kirjoitettuja. 

Pöllölaakson uutistoimittajat.

Vielä pari vuotta sitten en olisi uskonut, että tekoäly pystyy tuottamaan tällaisia kuvia melkeinpä ilmaiseksi ja napin painalluksella, odottaessa. Tällä on suuria vaikutuksia graafiseen tuotantoon.

Sorasta emme tiedä vielä mitään. Demovideot näyttävät hyviltä, mutta ne on tietysti valittu tarkoin. Emme tiedä, kuinka moni videoista onnistui ja kuinka moni päätyi leikkaamon lattialle - tai siis tietokoneen deleted-kansioon. 

Jos videotuotanto muuttuu näin helpoksi, kuka tahansa pystyy loihtimaan tyhjästä esimerkiksi mainosvideoita tai yritysesittelyitä. Yhtä hyvin pystytään tuottamaan videoväärennöksiä, joissa länsivaltojen johtajat uhkaavat hyökätä Venäjälle tai epäsuosioon joutunut poliitikko lavastetaan jäämään kiinni rikoksesta, jota ei oikeasti tapahtunut. 

Vielä suurempi ongelma on siinä, että syväväärennökset vievät uskottavuutta myös oikeilta uutisvideoilta. Mikä tahansa epämieluisa video voidaan kuitata väärennökseksi. Emme enää erota totuutta valheesta.

Teknisesti olisi mahdollista varmistaa videotuotannon ketju aina kuvauksesta katsojalle asti. Se vaatisi jokaiseen ketjussa olevaan laitteeseen varmenteen ja digitaalisen allekirjoituksen, jonka aitouden katsoja voisi itse tarkistaa. Samanlainen tekniikka kuin nettisivujen SSL-varmenteissa siis. 

Ongelma on vain siinä, ettei tähän ole mitään standardia eikä vielä edes videokameroita, joissa varmennetta voisi käyttää. Uutisvideoiden jakeluketjussa voi olla lukuisia väliportaita kuvauksen, siirron, editoinnin ja jakelun eri tasoilla.

Joka tapauksessa videoväärennökset tulevat lisäämään perinteisen median arvoa. Vain siellä on mahdollista varmistaa videoiden aitous ja alkuperä. Luultavasti ammattilaisillekin tulee sattumaan virheitä, mutta ainakin vähemmän kuin villissä ja vapaassa nettilevityksessä, jolla ei jatkossa ole enää mitään arvoa. Nimittäisin tätä jopa perinteisen median vastaiskuksi. 

Joidenkin tietojen mukaan Sora pystyy tuottamaan enintään minuutin mittaisia videoita. Luultavasti niihinkin tarvittava laskentakapasiteetti on suuri ja sähkölasku tuntuva. Mutta kehitys on vääjäämätöntä, kun pää on kerran saatu auki ja nähty, mikä on teknisesti mahdollista. 

Vertailukohtana voi toimia vuoden 1903 ensimmäinen lento ilmaa raskaammalla laitteella, joka kesti 59 sekuntia. Siinä ajassa Wrightin veljesten alkeellinen kone eteni 260 metriä. Lähes tasan 10 vuotta sitten alkoivat Floridassa ensimmäiset kaupalliset lennot. Ja loppu on historiaa.

Lentäminen vaati mekaniikan kehittämistä ja on jatkuvaa taistelua fysiikan lakeja vastaan. Tietotekniikka taistelee lähinnä algoritmeilla ja ideoilla, joten kaiken kehittäminen on kertaluokkaa helpompaa kuin ilmailussa.

Nähtyäni Toy stories -elokuvan kirjoitin kolumnissa ajasta, jolloin katsoja voisi itse valita, kenet näyttelijät haluaa nähdä missäkin roolissa. Näyttelijät olisivat ikään kuin ladattavia tiedostoja. 

Uusimmassa Indiana Jones -elokuvassa esiintyy nuori Harrison Ford noin 25 minuutin ajan. Se osoittaa, ettei kolumnissa hahmottelemani tulevaisuudennäkymä ole enää kaukana.

6 kommenttia:

J kirjoitti...

Singulariteettiä peliin, kyllä se siitä suttaantuu.

Jari kirjoitti...

Hyvinhän se MTV:n lähetys näytti menevän.

Kaikki muuttuu, mutta mikään ei muutu. Toy Stories oli aikanaan pieni sensaatio, ja 1990-luku toi 3D-grafiikan myös peleihin. Silloin oli päivän selvää, että fotorealistinen grafikka tulee. Kun ketsuppipullo aukesi, niin seuraukset ovat järisyttäviä esimerkiksi nVidian osakekurssille. Maailma on kuitekin ollut jo koko 2000-luvun photoshoppaamisen ja valeuutisten temmellyskenttää.

Toisaalta näkemyksemme tekoälystä on rajoittunut. Miksi meille ei merkitse mitään, että tekoäly päättää yhä enemmän lainan myöntämisestä, ruuan hinnoittelusta ja jääkiekko-otteluiden ajankohdista? Näissä kaikissa tekoäly pyrkii maksimoimaan yritysten liikevoittoa riippumatta siitä, että käyttääkö asiakas rahaa todelliseen tarpeeseen vai psykologisen jonkin taipumuksen vuoksi.

Generatiivisen tekpälyn saama huomio ihmetyttää myös siksi, ettei aidolle lukemiselle tai keskuskustelulle ei ole ollut viime aikoina erityistä tilausta. Välttämättä uutiskuvatkaan ei kiinnostaneet kuten aikanaan. Kun generoitu sisältö yleistyy niin mielenkiinto mediaan vähentynee edelleen.

Tässä muuten aitoa kuvaa vanhasta Pöllölaaksosta:
https://www.youtube.com/watch?v=7zmZbjejo-Y

Olavi Koskela kirjoitti...

Enpä ole erityisen innoissani tai kiinnostunut tekoälyn aikaansaannoksista, sen enempää tekstin tai kuvienkaan osalta. Tuotoksethan lopulta aina perustuvat ihmisten koneelle syöttämiin aineistoihin ja ohjeisiin hahmojen tunnistamiseksi ja yhdistelemiseksi. Se on siis aina periaatteessa tylsää divarimatskua. Tekoälyn tutkijoiden ja kehittäjien tulisi palata oikeastaan alkuun: sen kattavaan määrittelemiseen, mitä se äly tai älykkyys viime kädessä on. Sehän ei todellakaan ole kuin hyvin hyvin rajatussa mielessä esimerkiksi kuvio- tai numeeristen tehtävien ratkaisukykyä - mitä niin suositaan nk älykkyystesteissä. Tästä rajallisuudesta hyvä osoitus ovat nämä Mensan hyväkkäät. Milloin ja missä yhteydessä heiltä on irronnut toimivia ratkaisuja esimerkiksi talouspoliittisiin ongelmiin - joita tässä maassa on kyllä nokko?

Anonyymi kirjoitti...

Tuossa vähän aikaa sitten mietin suurentaisinko erään valokuvani saariston auringonlaskusta 70x50 kokoon seinälle. Kuvaan liittyvät muistot siitä, missä ja milloin se on otettu ja mitä muuta tein siellä silloin jne. Jos jokin kuvageneraattori pystyisi tekemään pikselilleen samanlaisen kuvan, se ei olisi muuta kuin merkityksetön pikselikokoelma, sillä ei olisi minulle mitään arvoa enkä ripustaisi sellaista seinälle. Ratkaisevaa on se, että minun kuvani on syntynyt altistamalla kenno sähkömagneettiselle säteilylle, se on kuva ympäröivästä todellisuudesta siellä ja sillä hetkellä, eikä piirretty lunttaamalla muista auringonlaskukuvista. Se, ettei noita kuvia pystyisi erottamaan toisistaan vain kertoo, että "there's more than meets the eye."

Anonyymi kirjoitti...

Kirjoitapa teksti siitä miten AI on pilannut somen! Kaikki mainokset ovat nykyään sitä itseään täynnä. Mistään ei tiedä mutta voi vaan arvata että feikkejä kaikki kuvat. Mm. Julkkikset tekemässä yhtä sun toista, tunnettuja maisemia tai rakennuksia, eläimiä jne. Mutta mikään ei ole oikeaa!
On liian helppoa ja halpaa luoda tätä shittiä ja yrittää saada mainostuloja. Facebook varmaan pahin, feed täysin käyttökelvoton nykyään.

J kirjoitti...

Nyt täytyy ymmärtää kaikkien että nyt eletään esisingulariteettista aikaa ja asiat ovat uusia. Moni on hätääntynyt kun tietokoneet nyt sitten yleistyvät. Hyvänä puolena asiassa on, että asioiden muutosnopeus tulee vielä kiihtymään. Sitten kun olemme varsinaisessa singulariteetissä muutoksen nopeus tulee kasvamaan rajusti. Petteri voisi kirjoittaa juuri tästä kiihtymisilmiöstä.Muutosta ei kannata pelätä sillä se tulee olemaan lopullisesti niin nopea, että asiat ns. suttaantuvat.
http://jpoli.blogspot.com/2024/03/teknologian-kehitysta-kannattaa-aina.html