tiistai 27. helmikuuta 2024

Turingin testi myös luovuuden mittaamiseen

Ilmeisesti ainoa tapa mitata tekoälyn kykyä luovuuteen olisi soveltaa klassista Turingin testiä.


TEKOÄLYN kehitys on edennyt merkilliseen vaiheeseen: insinöörit rakentavat uusia, yhä läheisemmin ihmisen sisäisiä prosesseja matkivia ohjelmia ymmärtämättä täysin, mitä ovat tekemässä ja missä maali sijaitsee. Operoimme käsitteillä kuten kieli, äly ja tietoisuus, vaikka emme osaa täsmällisesti määritellä niitä. Inhimilliset ominaisuudet ovat paitsi tuntemattomia, myös arkaluontoisia.


Parikymmentä vuotta sitten professori Tatu Vanhanen kohahdutti väittämällä, että pohjoiset kansat olivat älykkäämpiä kuin eteläiset, mikä osaltaan selitti Kreikan talousvaikeuksia. Nyt kehitämme keinotekoista älyä tietämättä, mihin se voisi johtaa.


Sama pätee luovuuteen. Aihe onkin herättänyt keskustelua, viimeksi tekoälyllä tuotettujen teosten käyttöarvosta (”Tekoälyllä tuotettujen taideteosten käyttöarvo on valtava”, HS Mielipide 22.2.2024).


Selvästikään luovuus ei tarkoita uuden tekemistä tyhjästä, koska lukija tai katsoja tarvitsee jotain kiintopisteitä vanhaan. Aivan uusi ja ennen näkemätön ei luultavasti herättäisi vastaanottajassa mitään reaktiota.


Menestyneet taiteilijat yhdistävät aiemmin näkemäänsä ja kuulemaansa uudella tavalla. Kun lopputulos eroaa riittävän paljon alkuperäisistä ja herättää muissa ihmisissä reaktioita, teoskynnys ylittyy ja luovuus on tullut osoitetuksi. Mutta onko merkitystä sillä, tekeekö yhdistelyn ihminen vai tekoälyn algoritmi? Ilmeisesti ainoa tapa mitata tekoälyn kykyä luovuuteen olisi soveltaa klassista Turingin testiä. Vuonna 1950 brittiläinen matemaatikko Alan Turing kehitti nimeään kantavan testin, jossa kaksi henkilöä käy tekstipohjaista keskustelua tietokoneen kanssa.


Jos tekoäly osaa viestiä totta ja valetta niin hyvin, etteivät ihmiset pysty erottamaan tulevatko vastaukset koneelta vai ihmiseltä, tekoälyä voidaan pitää riittävän tietoisena ja älykkäänä – ihmisen kaltaisena. Millä mekanismilla tämä tapahtuu, on sivuseikka.


Ehdotan vastaavan kokeen soveltamista tekoälyn luovuuteen. Sinä päivänä, kun testihenkilöt eivät pysty erottamaan kymmenestä taideteoksesta tai musiikkikappaleesta, kummat viisi ovat ihmisen ja kummat viisi koneen tekemiä, tekoälyn luovuuden voidaan katsoa olevan riittävän aitoa ja koko kysymys menettää merkityksensä. Valtaosa sisällöstä tuotetaan nykyisin nopeaa kaupallista kulutusta varten, eikä se saakaan olla liian luovaa. Tehdasmaisen tuotannon voisi jo nyt siirtää tekoälylle. Kenties on jo siirrettykin?


Julkaistu Helsingin Sanomissa 27.2.2024


Lisäys 4.3.2024: Tällainen testi näyttää tulleen jo tehdyksi

4 kommenttia:

S kirjoitti...

Tuolla kriteerillä koneet ovat jo ohittaneet ihmisen aikoja sitten.

Anonyymi kirjoitti...

Turingin testi on hyvä koska se on oikeasti vaikea. En antaisi esim. nykyisen ChatGPT:n suoriutumisesta enempää kuin 1-2 pistettä asteikolla 0-100. Jos tekoäly pärjäisi Turingin testissä se olisi luultavasti muillakin tavoin yhtä älykäs kuin ihminen ja tällä olisi voimakkaita yhteiskunnallisia vaikutuksia.

Vaikka tekoäly osaisikin tehdä (ja luultavasti jo osaakin tehdä) taideteoksia sillä ei ole suuria yhteiskunnallisia vaikutuksia muuten kuin taiteilijoiden ammattikunnalle.

Anonyymi kirjoitti...

@Petteri

Vuonna 1950 brittiläinen matemaatikko Alan Turing kehitti nimeään kantavan testin, jossa kaksi henkilöä käy tekstipohjaista keskustelua tietokoneen kanssa.

Turing testistä on useimmilla ihmisillä vääristynyt kuva. Ensinnäkin nykyisin käytetty nimitys on otettu käyttöön vasta myöhemmin. Alan Turing käytti siitä nimeä "imitation game" ja hänen kuvaamassa testissä oli kolme henkilöä, kuten David Leavitt'in kirjan mukaan josta lainaan tähän pätkän:

The Man who knew too much - Alan Turing and the Invention of the Computer,
David Leavitt, 2006, ISBN 978-0-75382200-5
-----------------------------------------------------------------------
[page: 240]
...
2.

"Computing Machinery and Intelligence," Alan Turing's most famous and
in many ways most perverse paper, appeared in Mind in October
1950. Whereas in the NPL report he started with likely objections,
here he saved the list of potential objections to computer
intelligence for later, and began instead

[page: 241]
with a clear statement of his intent. "I propose to consider the
question, Can machines think?" This should begin with definitions of
the meaning of the terms 'machine and think? » But if these meanings
"are to be found by examining how they are commonly used it is
difficult to escape the conclusion that the meaning and the answer to
the question, 'Can machines think? is to be sought in a statistical
survey such as a Gallup poll" Such an idea, in Turing's view, was
"absurd."

Instead of offering definitions, Turing recast his question by
proposing what he called the imitation game. It would later become
known as the Turing test, much as the a-machine of "Computable
Numbers" has come to be called a Turing machine. The game, as he
explains it,

is played with three people, a man (A), a woman (B), and an
interrogator (C) who may be of either sex. The interrogator stays in
a room apart from the other two. The object of the game for the
interrogator is to determine which of the other two is the man and
which is the woman.
He knows them by labels X and Y, and at the end of
the game he says either "X is A and Y is B" or "X is B and Y is A.
The interrogator is allowed to put questions to A and B thus:

C: Will X please tell me the length of his or her hair?
Now suppose X is actually A, then A must answer. It is A's object in
the game to try and cause C to make the wrong identification. His
answer might therefore be

"My hair is shingled, and the longest strands are about nine inches
long." In order that tones of voice may not help the interrogator the
answers should be written, or better still, type-

[page: 242]
written. The ideal arrangement is to have a teleprinter communicating
between the two rooms. Alternatively the question and answers can be
repeated by an intermediary.

The object of the game for the third player (B) is to help the
interrogator. The best strategy for her is probably to give truthful
answers. She can add such things as "I am the woman, don't listen to
him!" to her answers, but it will avail nothing as the man can make
similar remarks.

We now ask the question, "What will happen when a machine takes the
part of A in this game?" Will the interrogator decide wrongly as
often when the game is played like this as he does when the game is
played between a man and a woman? These questions replace our
original, "Can machines think?"
...
-----------------------------------------------------------------------

Anonyymi kirjoitti...

"Aivan uusi ja ennen näkemätön ei luultavasti herättäisi vastaanottajassa mitään reaktiota."


Jackson Pollock'in teoksissa oli fraktaaleja jo 40-luvulla, vaikkei tiennytkään niistä mitään pienessä maistissa maalatessan. Nehän löivät läpi vasta 90-luvulla.

Wikipedia(Fractal expressionism)