Linkit

tiistai 27. helmikuuta 2024

Turingin testi myös luovuuden mittaamiseen

Ilmeisesti ainoa tapa mitata tekoälyn kykyä luovuuteen olisi soveltaa klassista Turingin testiä.


TEKOÄLYN kehitys on edennyt merkilliseen vaiheeseen: insinöörit rakentavat uusia, yhä läheisemmin ihmisen sisäisiä prosesseja matkivia ohjelmia ymmärtämättä täysin, mitä ovat tekemässä ja missä maali sijaitsee. Operoimme käsitteillä kuten kieli, äly ja tietoisuus, vaikka emme osaa täsmällisesti määritellä niitä. Inhimilliset ominaisuudet ovat paitsi tuntemattomia, myös arkaluontoisia.


Parikymmentä vuotta sitten professori Tatu Vanhanen kohahdutti väittämällä, että pohjoiset kansat olivat älykkäämpiä kuin eteläiset, mikä osaltaan selitti Kreikan talousvaikeuksia. Nyt kehitämme keinotekoista älyä tietämättä, mihin se voisi johtaa.


Sama pätee luovuuteen. Aihe onkin herättänyt keskustelua, viimeksi tekoälyllä tuotettujen teosten käyttöarvosta (”Tekoälyllä tuotettujen taideteosten käyttöarvo on valtava”, HS Mielipide 22.2.2024).


Selvästikään luovuus ei tarkoita uuden tekemistä tyhjästä, koska lukija tai katsoja tarvitsee jotain kiintopisteitä vanhaan. Aivan uusi ja ennen näkemätön ei luultavasti herättäisi vastaanottajassa mitään reaktiota.


Menestyneet taiteilijat yhdistävät aiemmin näkemäänsä ja kuulemaansa uudella tavalla. Kun lopputulos eroaa riittävän paljon alkuperäisistä ja herättää muissa ihmisissä reaktioita, teoskynnys ylittyy ja luovuus on tullut osoitetuksi. Mutta onko merkitystä sillä, tekeekö yhdistelyn ihminen vai tekoälyn algoritmi? Ilmeisesti ainoa tapa mitata tekoälyn kykyä luovuuteen olisi soveltaa klassista Turingin testiä. Vuonna 1950 brittiläinen matemaatikko Alan Turing kehitti nimeään kantavan testin, jossa kaksi henkilöä käy tekstipohjaista keskustelua tietokoneen kanssa.


Jos tekoäly osaa viestiä totta ja valetta niin hyvin, etteivät ihmiset pysty erottamaan tulevatko vastaukset koneelta vai ihmiseltä, tekoälyä voidaan pitää riittävän tietoisena ja älykkäänä – ihmisen kaltaisena. Millä mekanismilla tämä tapahtuu, on sivuseikka.


Ehdotan vastaavan kokeen soveltamista tekoälyn luovuuteen. Sinä päivänä, kun testihenkilöt eivät pysty erottamaan kymmenestä taideteoksesta tai musiikkikappaleesta, kummat viisi ovat ihmisen ja kummat viisi koneen tekemiä, tekoälyn luovuuden voidaan katsoa olevan riittävän aitoa ja koko kysymys menettää merkityksensä. Valtaosa sisällöstä tuotetaan nykyisin nopeaa kaupallista kulutusta varten, eikä se saakaan olla liian luovaa. Tehdasmaisen tuotannon voisi jo nyt siirtää tekoälylle. Kenties on jo siirrettykin?


Julkaistu Helsingin Sanomissa 27.2.2024


Lisäys 4.3.2024: Tällainen testi näyttää tulleen jo tehdyksi

4 kommenttia:

  1. Tuolla kriteerillä koneet ovat jo ohittaneet ihmisen aikoja sitten.

    VastaaPoista
  2. Turingin testi on hyvä koska se on oikeasti vaikea. En antaisi esim. nykyisen ChatGPT:n suoriutumisesta enempää kuin 1-2 pistettä asteikolla 0-100. Jos tekoäly pärjäisi Turingin testissä se olisi luultavasti muillakin tavoin yhtä älykäs kuin ihminen ja tällä olisi voimakkaita yhteiskunnallisia vaikutuksia.

    Vaikka tekoäly osaisikin tehdä (ja luultavasti jo osaakin tehdä) taideteoksia sillä ei ole suuria yhteiskunnallisia vaikutuksia muuten kuin taiteilijoiden ammattikunnalle.

    VastaaPoista
  3. @Petteri

    Vuonna 1950 brittiläinen matemaatikko Alan Turing kehitti nimeään kantavan testin, jossa kaksi henkilöä käy tekstipohjaista keskustelua tietokoneen kanssa.

    Turing testistä on useimmilla ihmisillä vääristynyt kuva. Ensinnäkin nykyisin käytetty nimitys on otettu käyttöön vasta myöhemmin. Alan Turing käytti siitä nimeä "imitation game" ja hänen kuvaamassa testissä oli kolme henkilöä, kuten David Leavitt'in kirjan mukaan josta lainaan tähän pätkän:

    The Man who knew too much - Alan Turing and the Invention of the Computer,
    David Leavitt, 2006, ISBN 978-0-75382200-5
    -----------------------------------------------------------------------
    [page: 240]
    ...
    2.

    "Computing Machinery and Intelligence," Alan Turing's most famous and
    in many ways most perverse paper, appeared in Mind in October
    1950. Whereas in the NPL report he started with likely objections,
    here he saved the list of potential objections to computer
    intelligence for later, and began instead

    [page: 241]
    with a clear statement of his intent. "I propose to consider the
    question, Can machines think?" This should begin with definitions of
    the meaning of the terms 'machine and think? » But if these meanings
    "are to be found by examining how they are commonly used it is
    difficult to escape the conclusion that the meaning and the answer to
    the question, 'Can machines think? is to be sought in a statistical
    survey such as a Gallup poll" Such an idea, in Turing's view, was
    "absurd."

    Instead of offering definitions, Turing recast his question by
    proposing what he called the imitation game. It would later become
    known as the Turing test, much as the a-machine of "Computable
    Numbers" has come to be called a Turing machine. The game, as he
    explains it,

    is played with three people, a man (A), a woman (B), and an
    interrogator (C) who may be of either sex. The interrogator stays in
    a room apart from the other two. The object of the game for the
    interrogator is to determine which of the other two is the man and
    which is the woman.
    He knows them by labels X and Y, and at the end of
    the game he says either "X is A and Y is B" or "X is B and Y is A.
    The interrogator is allowed to put questions to A and B thus:

    C: Will X please tell me the length of his or her hair?
    Now suppose X is actually A, then A must answer. It is A's object in
    the game to try and cause C to make the wrong identification. His
    answer might therefore be

    "My hair is shingled, and the longest strands are about nine inches
    long." In order that tones of voice may not help the interrogator the
    answers should be written, or better still, type-

    [page: 242]
    written. The ideal arrangement is to have a teleprinter communicating
    between the two rooms. Alternatively the question and answers can be
    repeated by an intermediary.

    The object of the game for the third player (B) is to help the
    interrogator. The best strategy for her is probably to give truthful
    answers. She can add such things as "I am the woman, don't listen to
    him!" to her answers, but it will avail nothing as the man can make
    similar remarks.

    We now ask the question, "What will happen when a machine takes the
    part of A in this game?" Will the interrogator decide wrongly as
    often when the game is played like this as he does when the game is
    played between a man and a woman? These questions replace our
    original, "Can machines think?"
    ...
    -----------------------------------------------------------------------

    VastaaPoista
  4. "Aivan uusi ja ennen näkemätön ei luultavasti herättäisi vastaanottajassa mitään reaktiota."


    Jackson Pollock'in teoksissa oli fraktaaleja jo 40-luvulla, vaikkei tiennytkään niistä mitään pienessä maistissa maalatessan. Nehän löivät läpi vasta 90-luvulla.

    Wikipedia(Fractal expressionism)

    VastaaPoista