sunnuntai 24. tammikuuta 2021

Onnellinen valkoinen nainen

Viime syksynä netissä osui silmiini väite, jonka mukaan Google pyrkii aivopesemään ihmisiä liberaaleihin arvoihin. Kun hakukoneella etsii happy white woman, tuloksena on kuvia, joissa valkoinen nainen on yhdessä mustan miehen kanssa. Erään äärisivuston mielestä tämä on "editorial decision on the part of Google to show White women with dark men", jonka lopullisena tavoitteena on valkoisen rodun tuhoaminen, suoranainen "white genocide".

Samantapaisia väitteitä ovat levittäneet Suomessa persujen nettiaktiivit. Mutta onko Googlen kuvahaku todella arvoliberaalia ajatusten muokkausta vai onko asialle muita selityksiä?

Kokeilu osoittaa, että kuvahaku todella tuottaa väitetyn tuloksen. Ykkösenä on kuvapankin kuva, jossa musta mies silittää raskaana olevan valkoisen naisen vatsaa. Kieltämättä erikoinen valinta "onnelliseksi valkoiseksi naiseksi".

Happy white woman - Google

Tuloksista huomaa, miten asian kokeileminen alkaa pian vaikuttaa tutkittavaan asiaan. Tuloksiin ilmestyy sivuja, joilla ihmiset ovat kokeilleet samaa hakua. Prosessi alkaa ruokkia itse itseään, mikä on yleinen vaara vuorovaikutteisissa algoritmeissa ja koneoppimisessa. (Oma kuvani on parin viikon takaa, nykyään tulos voi olla erilainen, vielä vääristyneempi).

Voidaan kuitenkin olettaa, että alkuperäinen väite on pitänyt paikkansa. Miksi ensimmäisenä tarjotaan rotujen välistä parikuvaa, vieläpä toisen kerran peilattuna? Kokeillaanpa muita hakuja.

Happy black woman - Google

Mustien naisten haku tuottaa odotetun tuloksen. Yhtään valkoista ei ole joukossa, ei liioin parikuvia. Sama tulos aasialaisilla naisilla.

Happy asian woman - Google

Teoria tahallisesta arvomuokkauksesta vahvistuu, kun tekee vastaavan haun Duckduckgo-hakukoneella. 

Happy white woman - Duckduckgo

Duckduckgo antaa tulokseksi pelkkiä valkoisia naisia. Mielenkiintoista. Kyse ei ole kuitenkaan puolueettomasta hakukoneesta, vaan tulokset ovat liki suoraan Microsoftin Bing-hakukoneesta:

Happy white woman - Bing

Kiinnostavaa on, että Googlen kuvahakua hallinnut parikuva näkyy myös tässä listassa - mistähän kumman syystä juuri tämä kuvapankin kuva on näin suosittu?

Teoria arvoliberalismin pakkosyötöstä murenee viimeistään venäläisen Yandexin kohdalla:

Happy white woman - Yandex.

Yandex nostaa kärkeen kaksi mustaa parikuvaa. Valkoisten naisten hakeminen ei tosiaan näytä helpolta.  

Vielä yksi kokeilu:

Happy Finnish woman - Google

Suomalaisten naisten tulos on odotettu.

Vertailun vuoksi hakutulos myös Happy white man sanoilla: 

Happy white man - Google

Yllättäen ensimmäiset tulokset ovat mustia miehiä. Kolmas tulos on Miki Sileonin Twitter-viesti, jossa ihmetellään parikuvaa, joka on taas putkahtanut mukaan hakuun. Twiitin mukaan "Onko kyseessä Eurooppalaisen väestöön kohdistuva kansanmurhaa edistävä suggestiivinen viestintä? Neljäs kuva on itse otettu ruutukuva miesten hausta.

Tämä kaikki voi tuntua lapselliselta, mutta aihe on vakava. On erittäin terveellistä pohtia, millaisia tuloksia hakukoneet meille syöttävät ja miten niihin voidaan vaikuttaa -- niin tahallisesti kuin tahattomasti. Aiemmat haut, niin omat kuin muidenkin tekemät, voivat vääristää tuloksia yllättävällä tavalla. Ja sitten on vielä Google-pommit, joissa tietoisesti tai piloillaan nostetaan haluttu osuma tuloslistan kärkeen.

Mutta alkuperäinen kysymys on yhä vastaamatta: miksi valkoisen naisen hakeminen tuottaa kuvia sekapareista?

Ensinnäkin kuvien hakeminen on paljon vaikeampaa kuin tekstin hakeminen. Hakukone ei yritä tulkita kuvien sisältöä, vaan indeksoi kuvan metatietoja tai lähellä olevaa tekstiä. Lisäksi yksi kuva, johon on jostain syystä viitattu usein, voi nousta haun kärkeen, vaikkei se olisi täsmälleen sitä mitä haetaan. Kuvapankin kuvissa on usein laajat kuvailutiedot ja avainsanat, ja sivustoilla paljon liikennettä, joten ne nousevat helposti kärkeen.

Googlen insinööreillä olisi mahdollisuus ajatusten ohjailuun ja arvovaikuttamiseen. Siksi tuloksia kannattaa aina tarkastella kriittisesti.

En kuitenkaan usko, että tässä on tahallista vaikuttamista, vaan yksinkertainen fakta: valkoinen nainen on edelleen oletusarvo. Valkoisuus merkitään kuviin vain, jos se on jostain syystä merkittävä tekijä -- esimerkiksi yhdessä mustan miehen kanssa. Valkoisuus oletusarvona on siis juuri päinvastoin kuin miten äärioikeisto haluaa tuloksen tulkita. Haku Happy woman tuottaa lähes yksinomaan valkoisia naisia; vain pari aasialaista mahtuu ensimmäisen sadan kuvan joukkoon. Valkoinen on oletusarvo.

On vaarallista lähteä levittämään teorioita ja syytöksiä nettipalveluista, koska väärinäkin ne johtavat itseään vahvistavaan kierteeseen.

Bingin (Duckduckgon) muista poikkeava hakutulos johtuu siitä, että hakukone on huono. Sen havaitsee kun yrittää etsiä jotain muuta. Googlen antamat tulokset ovat huomattavasti relevantimpia kuin Bingin, jonka tulokset näyttävät sattumanvaraisilta.

Lisäys klo 21: Tuloksia saattaa vääristää myös kuvan valkoinen tausta.  

Happy white woman... white background.

Tätä kuvaa ympäröivissä teksteissä (luultavasti samat tiedot jpeg-tiedoston metatiedoissa) esiintyy kahdesti sana white, joten Google nostaa sen korkealle hakutuloksissa. 

Happy white man.

Sama ilmiö selittää myös sen, miksi "white man" haun ensimmäisessä kuvassa on musta mies: kyse on tässäkin valkoisesta taustasta. Mustaa taustaa käytetään henkilökuvissa hyvin harvoin.

Lisäys 25.1.2021: Vielä yksi juttu: "white woman" on ainakin jenkkikulttuurissa epätarkka ilmaisu. Ihmiset eivät koskaan ole valkoisia. Oikeampi termi on "caucasican woman". Sillä haettuna kuviin tulee yhtä poikkeusta lukuunottamatta vain länsimaalaisen vaaleita naisia.

Happy caucasian woman - Google.

Ainoa poikkeus on juuri tuo parikuva (joka on ilmeisesti photoshopattu kahdesta henkilöstä), jonka kuvauksena on teksti "A mixed couple, black man CAUCASIAN WOMAN pregnant standing for WHITE background with thumps up and very happy".

Lisäys 26.1.2021: Toinen vastaava haku näyttää olevan "american inventors", joka tekstinä oikeita nimiä (Edison, Bell, Morse, Ford...) mutta kuvahakuna tuottaa pelkkiä mustia miehiä. Tämäkin nettiuskomus on saanut alkunsa amerikkalaisilta keskustelupalstoilta jonkun tekemästä havainnosta ja vahvistaa nyt itse itseään. Mitä hyötyä kenellekään olisi vääristää keksijöiden kuvahaun tuloksia tarkoituksella? Asian levittäminen netissä kertoo enemmän levittäjistä kuin Googlesta.

On mahdollista, että vastaavia vääristymiä esiintyy muissakin Google-tuloksissa. Siksi lähdekriittisyys on tarpeen ja todisteet kiinnostavat. Mielellään jotain muuta kuin kuvia, kiitos.

35 kommenttia:

Anonyymi kirjoitti...

Muutama vuosi sitten kun haki "mustia teinejä" Googlesta niin tuli pidätyskuvia ja kun haki "valkoisia teinejä" niin tuli tavallisia oletettavasti ei rikollisia teinejä.
Googlea sitten syytettiin rasismista.

Anonyymi kirjoitti...

Jos hakee onnetonta valkoista naista eli "unhappy white woman" saa tulokseksi yhtä lukuunottamatta valkoisen aisen ilman mustaa miestä. Mitenkähän tämä olisi tulkittavissa ? Eikö näissäkin pitäisi olla se musta kumppani tuolla esittämälläsi logiikalla ?

Petteri Järvinen kirjoitti...

"Unhappy young woman on a off white background" - ei kannata tehdä liian pitkälle meneviä johtopäätöksiä hakukoneiden tuloksista.

Anonyymi kirjoitti...

No tällä selityksellä johtopäätökseni on, että "äärioikeistolaisten" tulkinta Googlen harrastamasta manipulaatiosta on oikea.

Anonyymi kirjoitti...

Niin.Voi että kun taas pitäisi vaan ymmärtää ja tiedostaa.Sama tilanne saman firman palvomista hienomman pigmentin ja rikkaamman kulttuurin omaavista paremmista ihmisistä olisi kuitenkin automaattisesti natsismia ja rasismia mutta toisinpäin sitä pitää nyt vaan ikuisesti ymmärtää ja tiedostaa.Koska et näe asiassa ongelmaa lienet natsi joka haluaa erivärisille ihmisille eri säännöt?Vinkataanpa iltasanomille että natsijärvisen mielestä neekereillä pitää olla omat säännöt.

Anonyymi kirjoitti...

Nettipornossa yleensä "interracial" tarkoittaa mustaa miestä ja valkoista naista. Eikä hakusanalla löydy ollenkaan aasialaista miestä ja mustaa naista tai valkoinen mies ja aasialainen nainen.
Ihmeellistä ettei ainakaan Suomessa ole alettu valittamaan kuinka nettiporno on rasistista, nettipornosta kun saisi väännettyä vaikka minkälaisia rasismisyytöksiä.

Anonyymi kirjoitti...

Mainittakoon myös, että "happy white man" näyttää antavan pääsääntöisesti pareja, joissa mies on valkoinen ja nainen värillinen, joten tämähän hiukan vahvistaa käsitystä Googlen algoritmin rasistisuudesta. Vai kuinka ?

Petteri Järvinen kirjoitti...

Ensimmäisenä hakutuloksena on musta mies, jonka yhteydessä on teksti "happy Afro American man smiling in studio on white isolated background". Valkoisuus viittaa siis kuvan taustaan, ei rotuun. Mustaa taustaa käytetään hyvin harvoin, se selittää paljon näistä kuvista.

Jos vähänkin luki ajatuksella kirjoitukseni niin tavoite oli sanoa, ettei kuvatulosten perusteella kannata tehdä hätiköityjä johtopäätöksiä yhtään mistään. Jos niitä tekee, ne alkavat toteuttaa itse itseään.

Anonyymi kirjoitti...

Silti kieltämättä vähän ihmetyttää, mistä se musta mies ilmestyy niihin valkoisen onnellisen naisen kuviin, kun hakusanoissa ei ole sitä mustaa mainittu ollenkaan. Ja tietysti myös se, että sama ei toistu sen onnettoman naisen tapauksessa. Että siis mikä niissä onnettoman naisen taustoissa on erilaista kuin onnellisen, että se musta mies ei pääse mukaan.

Petteri Järvinen kirjoitti...

Kuten kirjoituksessa luki, naisen valkoisuus on oletusarvo ja se mainitaan erikseen vain, mikäli kuvassa on myös musta. Nainen on niin usein valkoinen, ettei sitä tarvitse erikseen korostaa.

Unhappy-kuvien kärkituloksissa on mm. seuraavat tekstit:

"Unhappy casual surprising woman in WHITE short with big eyes and open mouth looking."
"portrait sad unhappy woman isolated on WHITE background. emotional girl isolated on WHITE background"
"Unhappy young woman on a off WHITE background"
"Isolated unhappy depressed young interracial couple WHITE woman and black man facing financial or health problems, praying, holding hands clasped, having mournful facial expressions"

Valkoisuus viittaa taustaan, paitsi tuloksessa numero neljä, jossa on musta mies ja naisen valkoisuus mainitaan sen vuoksi erikseen.

henris42 kirjoitti...

On kyllä Googlion algoritmeissä vielä kehittämistä. Jos laitan haun "white woman", tuskin olen hakemassa kuvaa naisesta valkoista taustaa vasten.

William Gallop kirjoitti...

Kokeilin hakua "Happy caucasian woman" ja tuloksena oli iloisia valkoisia naisia ja yksi musta-valko pari. Caucasian on tämä valkoihoisista käytetty nimitys

Petteri Järvinen kirjoitti...

Juuri näin. Suomalaista hämää, kun itse puhumme "valkoihoisista", vaikka kenenkään iho ei ole valkoinen. Jenkkitermi on "caucasian". Valkoinen väri viittaa valokuvan taustaan.

Tästä asiasta nostettu kohu ja taustalla nähty tahallinen mielipiteenohjailu on vaarallista. Kannattaa perehtyä asioihin ja selvittää ne, ennen kuin lähtee levittämään uskomuksiaan ja pelkojaan netissä.

henris42 kirjoitti...

Heh ei pidä paikaansa.

Kokeilin:
Black woman: pelkkiä tummaihoisia.
White woman: nyt vasta tuleekin mitä sattuu

Miksi häpeätte valkoisuuttanne?

henris42 kirjoitti...

Laittakaa googleen vaikka: White Jesus, Black Jesus, Asian Jesus.
Tulee mitä tilaa.

Anonyymi kirjoitti...

Etkö sellaisia kuvia sillä haulla saa. Kokeile.

Anonyymi kirjoitti...

Minäpä väitän, että Google väheksyy tummenpaa/ei-valkoista väestönosaa ja haluaa vahvistaa keskenään samanrotuisten pariskuntien ideologiaa.

Tämän todistavat haut "couple" ja "happy couple"

a) Montako rotujen välistä pariskuntaa löytyy?
b) Ei-valkoisten pariskuntien määrän suhde valkoisiin?

Anonyymi kirjoitti...

Ketähän se Michael Jackson tarkoitti, kun teki kappaleen Black or white. Olisi kai pitänyt olla Black or caucasian.

Anonyymi kirjoitti...

Jackson tarkoitti tietysti valkoisella valokuvan (tai jonkin muun) taustaa, koska eihän kenenkään ihonväri ole oikeasti valkoinen. Oletpa siis musta tai taustan värinen, ei väliä.

Petteri Järvinen kirjoitti...

On kiinnostavaa, millaisia nimettömiä kommentoija aihe saa mönkimään esiin. Ei ihme, että QAnonin kaltaiset hölmöydet leviävät. Ihmiset haluavat uskoa.

Omien kokeilujeni johtopäätös on edelleen: Naisen valkoisuus on oletusarvo, joka mainitaan erikseen vain, jos mukana on musta mies. Kun siihen vielä lisätään valkoinen tausta, tulee kuvan ympärille kaksi valkoinen-sanaa, mikä nostaa sen sijoitusta. Lisäksi, kuten kirjoitin, hakutulokset ruokkivat itse itseään, ja kun moni klikkaa tuota yhtä mustavalkoista parikuvaa, Google nostaa sitä yhä tärkeämmäksi.

Googlaa "happy couple", itselleni tuli pelkkiä valkoisia pareja (yksi missä molemmat tummia). Valkoisuus siis ON oletusarvo, jota ei mainita erikseen. Googlaa "happy couple white" niin saat pelkkiä valkoisia pareja valkoisella taustalla.

Ei Googlella ole omaa tahtoa, vain algoritmi jolla se yrittää päätellä kuvan sisällön lähellä olevista sanoista.

Anonyymi kirjoitti...

White Trash: The 400-Year Untold History of Class in America.

Anonyymi kirjoitti...

Asiaan voi saada vielä vähän lisää näkökulmaa. Vaihdetaan kieleen, jossa voidaan käyttää sanojen sukuja, esim. espanja.

Haussa "feliz mujer blanca", sana blanca, sukunsa mukaan käytännössä viittaa naiseen.
(Toki tuolla konteksissa voisi olla joku muukin feminiini sana, mutta sen saa tarkistettua kustakin hakutuloksesta)
Taustaan viitataan maskuliinilla, blanco ( =fondo). Haku tälle siis "feliz mujer blanco".

Ja yllättäen, salaliittoteoria saakin hiukan tukea...

Petteri Järvinen kirjoitti...

No jaa, miten sen nyt ottaa... pelkkä "feliz mujer" tuottaa vain valkoihoisia naisia. Eikö ole vain loogista, että jos hakuun lisää värin, se tuottaa kuvia joissa valkoisuus on erikseen merkitty - ja yleensä niin tehdään, jos kuvassa on joko toisen värinen ihminen tai esim. tausta on valkoinen.

Kokeillaan ranskaksi: "femme joyeuse" tuottaa vain valkoisia naisia (suunnilleen samat kuvat kuin espanjaksi), "heureuse femme blanche" valkoisia naisia ja ne samat kaksi parikuvaa (valkoinen nainen, musta mies) kuin muutkin kieliversiot. Italiaksi suunnilleen sama tulos ("felice donna" ja "felice donna bianca").

Pikemminkin tässä on takana 123rf.com ja dreamstime.com onnistunut hakukoneoptimointi.

Petteri Järvinen kirjoitti...

Jaa niin, suomi unohtui! Joko hakukoneoptimointi tai Googlen monikulttuurisuutta aivopesevät insinöörit ovat unohtaneet meidät kokonaan, sillä "onnellinen nainen" ja "onnellinen valkoinen nainen" ei tuota muita kuin valkoihoisia naisia - ei yhtään mustaa miestä. Ja tietenkin linkin tähän sivuun, koska asian vatvominen vaikuttaa jo lopputulokseen.

Anonyymi kirjoitti...

Huomioni kiinniittyy kuvakaappauksissa oikeaan ylänurkkaan, miksi Petteri tietokoneasiantuntijana on kirjautunut sisään Google Chromeen? Chromessa kun pystyisi laittamaan niin ettei se automaattisesti Gmailiin kirjautuessa kirjaudu myös Chromeen, toki myös Incognito-tila on keksitty.
Toinen huomioni kiinnittyyy että aika paljon lisäosia olet Chromeen antanut asentaa, mahdollisesti osa vahingossa?

Anonyymi kirjoitti...

Jeps, vähän vakavammin puhuen (parin tahallisesti vinoon vedetyn kommentin jälkeen), en näe viitteitä salaliitoista tässä yhteydessä.

Tässäpä onkin yksi algoritmien (alias black boxien) ongelma. Kun ei tiedä, miten ne toimivat, jää valtavasti tilaa spekulaatioille, eli muheva kasvualusta salaliittoteorioille.

Mutta tulipas kumminkin tällainen vastaan, kun vähän pyörittelin lisää:

Google haku "feliz mujer blanca site:es.123rf.com"

Ja haku suoraan sivulta: es.123rf.com => "mujer feliz blanca"

Eli päästään vertaamaan kahden eri algoritmin toimintaa.
Onko sittenkin eri algoritmeille väreillä väliä...?
Onkohan sama muiden kielten kohdalla?

Petteri Järvinen kirjoitti...

Samaa kokeilin itsekin muissa kuvapankeissa. Niiden omat haut toimivat ihan eri tavalla kuin Googlen haku ja antavat eri tuloksia. Ero on ymmärrettävä, sillä kuvapankin haku käyttää vain kuvaan tarkoituksella lisättyjä avainsanoja (joista osa saattaa olla sisäisiä ts. eivät näy tageina ulospäin), kun taas Google käyttää kaikkia sivulla kuvan ympärillä olevia tekstejä, aiempia hakuja ja sivuun ulkopuolelta osoittavien linkkien määrää.

Tässä suhteessa suomen kieli on hyvä indikaattori, koska ulkomaiset kuvapankit eivät lisää suomenkielisiä tageja. Jos kyse olisi Googlen tahallisesta manipuloinnista, kuvien pitäisi tulla näkyviin erityisen selvästi juuri suomeksi haettaessa. Nyt on päinvastoin.


Totta, lisäosien määrä kannattaa minimoida. Omassa selaimessani näkyvät on valittu erilaisia testejä varten. Kirjaudun Googlen palveluun, koska käytössä on useita koneita ja haluan seurata, millaista profiilia Google toimistani kerää.

Osmo kirjoitti...

Tässä kyse on siitä samasta kuin "straight couples" antoi kuvia homopareista. Ihmiset eivät käytä määritteitä kuten "straight" tai "white" ellei asiaan liity vastakohtaa. Moni olettaa Googlen analysoivan tekstiä enemmän kuin mitä se tekee. Pohjimmiltaan kyseessä on tyhmä tekstihaku, joka ei ymmärrä tekstin merkitystä.

Ajatus, että Google manipuloisi näitä hakuja on aika outo. Pikemminin olettaisin Duckduckgon tekevän niin vastineena näille uutisille Googlen manipuloinnista. Tosin kyllä sekin näytti mustia.

Taannoin "American Inventors" aiheutti väitteitä manipuloinnista. Se kuitenkin vain oli osa teksti "African-American inventors" lukuisilla sivuilla.

Petteri Järvinen kirjoitti...

Pilaat hyvän salaliittoteorian. Osa ihmisistä selvästi *haluaa* uskoa näihin, vaikka aihe itsessään olisi naurettava. Mitä ihmettä Google (tai joukko sen yksittäisiä työntekijöitä) saavuttaisi manipuloimalla jotain yksinkertaista kuvahakua? Ottaisi vain riskin potkuista tai rikossyytteistä.

Googlen ajatuksia ohjaavaa vaikutusta kannattaa aina pohtia, mutta todellisen vaikuttavuuden mittaaminen ja arviointi on hyvin vaikeaa. Mistä tiedämme, millaisia neutraalien hakutulosten pitäisi olla?

Anonyymi kirjoitti...

No, eipäs ollut tässäkään Googlella "värittynyttä" algoritmia...

Selitys on vähän tylsänkin yksinkertainen.
Lisävalaistusta asiaan saadaan, kun Googlen haku tehdään eri sanajärjestyksellä:

"feliz mujer blanca site:es.123rf.com" => alkuperäinen haku, Google mätsää muutamaan kuvaan, jossa on eksaksi sanapari "mujer blanca". Tämä järjestys espanjan kielessä tarkoittaa nimenomaan, että korostetaan naisen valkoisuutta. Voi olla vaikkapa siitä syystä, että toinen osapuoli kuvassa nimenomaan ei ole valkoinen.

"mujer feliz blanca site:es.123rf.com" => Edellisen haun ilmiötä ei synny.

Itse kuvapankki sitten tosiaan omassa haussaan käyttää avainsanoja tavalla, jolla näitä sanapareja ei mätsätä.

Anonyymi kirjoitti...

Yllättävän paljon rasisteja kömpi tähänkin säikeeseen levittämään harhaista maailmankuvaansa. Samat tyypit nökevät eurooppalaisen rodun tuhoavia salaliittoja joka puolella, mutta taas selvää rasismia he eivät havaitse missään.

- Syltty

Anonyymi kirjoitti...

Itse harrastan valokuvaamista kuvapankkeihin ja kuvaan valkoihoisia ihmisiä, en koskaan ole laittanut tägiä "valkoihoinen" koska onhan se vähän itsestään selvyys täällä. Tummaihoisia en ole toistaiseksi kuvannut mutta oletan että jos laittaisin kuvaan tägin "tummaihoinen" niin saisin rasismisyytöksiä.

Anonyymi kirjoitti...

En tiedä mitä sanoo algoritmista, mutta voit tehdä google hakuja, jotka etsivät sanoilla, jotka ovat juuri siinä järjestyksessä, juuri siinä muodossa jne laittamalla lainausmerkit niiden ympärille. Eli etsimällä ["happy white woman"] eikä [happy white woman] saat kuvia joihin on tägätty happy white woman, ei happy woman with white background.

Ihan vain ehdotus, jos tätä logiikka peliä pelattiin...

Petteri Järvinen kirjoitti...

Lainausmerkkihaku ei enää anna oikeita tuloksia, koska aiheesta on kirjoitettu niin paljon että algoritmi alkaa ruokkia itse itseään. Juuri tässä on oppivien ja adaptoivien algoritmien heikkous.

Anonyymi kirjoitti...

no juutalaiset omistaa googlen niin tottakai ne mädättää