tiistai 1. elokuuta 2017

Facebookin salakuuntelu vai sattuman sanelema juttu?

Minulta kysytään usein, salakuunteleeko Facebook käyttäjiään, kun sen esittämät mainokset osuvat joskus pelottavan hyvin kohdalleen. Yleensä kyse on Facebookista, joskus samaa epäillään myös Instagramista -- ja nehän ovatkin jo pitkään olleet samaa yhtiötä. Toimittaja soitti aiheesta taas viime viikolla, joten epäilys askarruttaa ihmisiä edelleen.

Vastaus on, ettei kukaan tiedä varmaksi. Salakuuntelu on äärimmäisen epätodennäköistä, koska se kuluttaisi akkua ja olisi varsin tehotonta mainosten kohdentamisessa. Lisäksi salakuuntelu olisi tavaton riski yhtiölle itselleen. Jos asia paljastuisi, osakkeenomistajat menettäisivät miljardeja kurssilaskun ja epäluottamuksen kasvun seurauksena.

Salakuuntelua vastaan puhuu sekin, ettei kukaan ole vielä pystynyt näyttämään salakuuntelua toiminnassa. Joskus mainokset tuntuvat liittyvän asiaan, jota puhelimen vieressä on puhuttu, mutta seuraavana päivänä samaa ei enää tapahdukaan. Miksi salakuuntelu olisi käytössä vain ajoittain?

Voi olla, että puhelimessa on jokin toinen sovellus, joka vaikuttaa mainosten valintaan puheen perusteella. Sekään ei selitä, miksi mainokset osuvat kohdalleen vain harvoin, eikä joka kerta.

Yksi -- ja hyvin tylsä -- selitys on puhtaasti matemaattinen. Todennäköisyyslaskenta toimii ajoittain tavalla, joka näyttää olevan ristiriidassa ihmisen intuition kanssa. Luin kesällä aiheesta kirjan, jota suosittelen muillekin kiinnostuneille: The Improbability Principle (David Hand, 2014).

The Improbability Principle
Kirjan alaotsikko kertoo, mistä on kyse: Why Coincidences, Miracles and Rare Events Happen All the Time eli Miksi sattumia, ihmeitä ja harvinaisia tapahtumia esiintyy koko ajan.

Kirja kertoo esimerkiksi brittiläisestä pariskunnasta, jonka mies ja vaimo joutuivat molemmat eri junaonnettomuuteen 15 vuoden välein. Molemmissa syykin oli sama: ylimääräinen ajoneuvo raiteilla. Junaonnettomuudet ovat erittäin harvinaisia, joten miten on mahdollista, että molemmat joutuivat sellaiseen?

Junaonnettomuuksien tilastomatematiikka on vaikeaa, koska mukana on niin paljon reaalimaailman muuttujia, mutta lottoarvonnat ovat matemaattisesti helppoja. Miten todennäköistä on, että Pohjois-Carolinan Cash 5 -lotossa arvottiin samat voittonumerot 9.7. ja 11.7.2007? Vastaava tapahtui Israelissa 16.10.2010, mutta arvontojen välillä oli muutama viikko (21.9.). Tapaus uutisoitiin Suomessakin. Bulgarian lotossa samat kuusi numeroa 49:stä (13 983 816 vaihtoehtoa) arvottiin 6.9.2009 ja uudelleen seuraavalla viikolla 10.9.2009.

Todennäköisyyden sille, että samat numerot arvotaan kahdesti peräkkäin täytyy olla astronomisen pieni -- tai sitten joku on näpelöinyt arvontakonetta. Mutta itse asiassa ei ole: kirjassa Hand todistaa, että päinvastoin olisi epäilyttävää, jos samoja numeroita ei koskaan arvottaisi uudelleen. Maailmassa on niin monia lottoarvontoja, että jossain niissä samat numerot toistuvat varmasti. Oikeasti tähtitieteellisen harvinaista olisi saada toistumaan juuri tietyt numerot ja juuri tietyn maan lotossa tiettyyn aikaan. Aiheesta on näköjään keskusteltu myös Tiede-lehden palstalla.

Sama ilmiö näkyy myös toisinpäin. Media uutisoi ihmisistä, jotka ovat voittaneet lottopotin kahdesti. Tällaisten täytyy olla syntynyt todella onnellisten tähtien alla -- tai sitten kyse on vain matematiikasta. On nimittäin suorastaan todennäköistä, että voitot osuvat uudelleen myös samoille henkilöille. Päinvastainen olisi harvinaista.

Uutisten mukaan vantaalaisella perheellä oli "satumainen onni" heidän voitettuaan ensin suuren summan ja sen jälkeen Naapurit-pelissä vielä pienemmän, sekin 100 000 euroa. Myös muita onnekkaita löytyy. Kirjassa Hand nimeää lukuisia vastaavia tuplavoittajia USA:sta.

Entä mitäpä sanot Maureen Wilcoxin tapauksesta vuodelta 1980: hän osti liput sekä Rhode Islandin että Massachusettsin lottoihin. Molemmissa oli oikeat numerot, mutta valitettavasti toisen osavaltion arvontaan (Rhode Islandin numerot Massachusettsin arvonnassa ja päinvastoin).

Näennäisesti epätodennäköisten tapausten taustalla on usein ns. syntymäpäiväparadoksi, joka on tärkeä periaate mm. kryptografiassa. Sitä voi havainnollistaa näin: kuinka monta henkilöä huoneessa pitää olla, jotta todennäköisyys kahdelle yhteiselle syntymäpäivälle kasvaa yli 50 prosentin (on siis todennäköisempää, että kahdella on sama syntympäivä kuin että kaikki olisivat syntyneet eri päivinä)?

Koska syntymäpäivillä on 366 eri mahdollisuutta, intuitiivisesti tuntuu, että henkilöitä pitäisi olla puolet tästä -- siis noin 185. Juju on kuitenkin siinä, että mitkä tahansa kaksi yhteistä syntymäpäivää riittävät. Oikea vastaus on niinkin alhainen kuin 23.

Kolme vuotta sitten olin kuuntelemassa Kaisa Nybergin kryptografia-luentoa. Hän demonstroi periaatetta käytännössä ja laittoi kiertämään listan, johon jokainen kirjoitti syntymäpäivänsä. Salissa oli luennoijan lisäksi 22 kuulijaa -- ja toden totta, näinkin pienestä joukosta löytyi peräti kaksi paria samoja syntymäpäiviä (6.1. ja 27.1.).

Joten kun ensi kerralla näet, että Facebook mainostaa asiaa, josta olet juuri puhunut ääneen, kyse saattaa olla puhtaasta sattumasta. Osuva mainos on lastenleikkiä kahteen samaan lottoriviin verrattuna.

Mutta jos saat mainokset toistumaan säännöllisesti puheen ohjaamina, ota yhteyttä -- ehkä pystymme vihdoin paljastamaan tämän salakuunteluohjelman.

Lisäys 4.8.2017: Miten todennäköistä on nähdä tietty auto ensin Espoossa ja seuraavana päivänä Helsingissä? Etenkin, kun on vähän aikaisemmin kirjoittanut sattumista blogiin? Luultavasti ei kovin todennäköistä, sillä autoja on kymmeniä tuhansia.

Näin 3.8.2017 Espoossa iltakävelyllä mustan ässämersun, jonka rekisterikilpi herätti huomioni:

Leppävaara 3.8.2017
Seuraavana päivänä kuvatessani Helsingin Töölössä Temppeliaukion kirkolla samainen auto toi nuoren naisen alkavaan vihkiseremoniaan:

Töölö 4.8.2017
Saman auton havaitseminen peräkkäisinä päivinä kahdessa eri kaupungissa (vieläpä samasta kuvakulmasta) ei liene kovin yleistä -- vai onko? Jos auto olisi ollut valkoinen Bemari tai harmaa Skoda, olisinko edes huomannut sattumaa? Tässä tapauksessa panin yhteensattuman merkille vain auton erikoisuuden vuoksi. Vastaavia sattumia voi tapahtua viikoittain sitä tiedostamatta.

Ehkä tämä selittää osan Facebookin mainoksista. Kiinnitämme huomiota mainoksiin vain silloin, kun ne sattumalta osuvat erityisen hyvin. Muut mainokset soljuvat ohi seinällä ilman mitään reaktiota.

Tässä vielä muutamia poimintoja kirjassa mainituista sattumista:

- Mary Wohlfordin (Freeport, Illinois) neljä ensimmäistä tytärtä syntyivät kolmas elokuuta vuosina 1949, 1951, 1952 ja 1954.

- Jason ja Jenny Cairns-Lawrence olivat New Yorkissa 11.9.2001, Lontoossa 7.7.2005 ja Mumbaissa 2008 -- kaikissa näissä tapahtui terrori-isku.

- Juristi John Woods perui lentonsa 21.12.1988 (PanAmin jumbo joka räjäytettiin Lockerbien yläpuolella). Hän oli WTC:n 39. kerroksessa toimistossaan 26.2.1993, kun kellarissa räjähti autopommi ja 11.9.2001 hän lähti toimistolta juuri ennen lentokoneen törmäystä.

Joten ehkä osuvat Facebook-mainokset eivät olekaan niin epätodennäköisiä sattumia.

Lisäys 18.9.2017: Helsingistä löytyi eilen neljä ruumista. Tapaukset eivät liittyneet mitenkään toisiinsa, kyse oli vain sattumasta. 

9 kommenttia:

Markus kirjoitti...

Samoja ilmiöitähän huomaa, jos pitää kalenterissa ylhäällä koko tuttava/ystäväpiirinsä sekä sukunsa syntymäpäiväjuhlia.

Saattaa helposti taivastella, että niitä syntymäpäiviä tuntuu riittävän varsinkin aikuisiällä... Samoina päivinä on monienkin syntymäpäiviä ja saman ikäisiäkin vielä.

No tuossakin taas mennään vain simppeliin matematiikkaan. Eihän vuodessa ole kuin 365 päivää. jos tuttaviakin/sukulaisia/näiden lapsia, kummeja yms on vaikkakin parisataa, on tietysti väistämätöntä, että montakin juhlaa osuu samalle päivälle.

Sitten kun vielä on nämä luonnonlait laskettu mukaan asiaan, monet ovat ihan ilmiselviä vappu/juhannusvauvoja ollut ....... Osuu vielä enemmän tiettyihin ryppäisiin. Kalenterissa voi olla jopa täysin tyhjiä kuukausia näiden suhteen...

Sitten tietysti kun sitä yleensä omanikäisten seurassa enimmäkseen aikaa viettää, tulee se viimeinen ihmestyksenaihekin selitettyä, ei ole mikään ihme vaikka sinun kanssasi osuisi samaan syntymäpäivään saman ikäinen kaveri...

Jari kirjoitti...

Ihmisillä on taipumus etsiä sattumilleen selityksiä. Terve vainoharhaisuus piti ihmisen elossa savannilla... Mutta psykologia ei voi kumoa sitä, että tuollainen salakuuntelu on oikea uhka.

Kiinnostaa enemmänkin se, kuinka paljon pelkästään kirjautumisajat kertovat meistä. Tekoäly voisi piirtää meistä tarkan psykologisen profiilin...

Anonyymi kirjoitti...

Myös sää on hyvä esimerkki: on yleistä että sää on jollain tavalla poikkeuksellinen, vaikka poikkeuksellista säätä pitäisi nimensä mukaisesti esiintyä harvoin. Onkin eroa, lasketaanko todennäköisyys sille, onko sää on millä tahansa tavalla vai tietyllä tavalla poikkeuksellinen.

Dr Jouni Laurila kirjoitti...

Vai olisiko niin että se mikä on mielessä tulee katsottua netistä ja sanottua. Siinä yhteys.

Netin käyttöä kyllä vakoilevat monet tahot.

Feyris Nyannyan kirjoitti...

^Jep, ei siihen puhumista tarvita, tietokoneella toistuu sama ilmiö. Se mitä olet juuri selaillut netissä, sitä mainostetaan facebookissa.

Petteri Järvinen kirjoitti...

Näissä jujuna on nimenomaan se, ettei asiaa ole koskaan haettu netistä - siitä on vain puhuttu puhelimen lähellä. Ja silti Facebook osaa mainostaa juuri tätä asiaa. http://pjarvinen.blogspot.fi/2015/03/epailyt-facebookin-salakuuntelusta.html

Aleksi kirjoitti...

Kaverin kanssa juteltiin Whatsappin puolella hänen kotikuntansa työpaikoista. Hetken päästä minun Facebook seinälle tulee mainos kaverin paikkakunnan vapaasta työpaikasta. Kaveri ja tuo avoin työpaikka oli toisella puolella Suomea minun sijaintiini nähden. Olisiko mitään mahdollisuutta, että Whatsapp antaa avainsanatietoja Facebookin käyttöön? Yksi mahdollisuus mainostietojen jaolle on myös käyttämäni Swiftkey näppäimistö puhelimessa, vaikka en ole sitä liittänyt Google-tiliin.

Petteri Järvinen kirjoitti...

Varmaan antaakin, ovathan ne nyt samaa firmaa, ja Facebook perui lupauksensa pitää Whatsapp-tiedot erillään muista. http://www.tivi.fi/Kaikki_uutiset/whatsapp-kertoi-isosta-muutoksesta-jaamme-kayttajatietosi-facebookin-kanssa-6577096

"Juteltiin" tarkoittaa ilmeisesti Whatsapp-pikaviestintää eikä puhelua? Jos kyse on chatista, Facebook voi hyvinkin poimia Whatsappista avainsanoja mainontanta tueksi, kuten em. linkki kertoo.

Anonyymi kirjoitti...

https://en.wikipedia.org/wiki/List_of_cognitive_biases

Ihminen ei aina toimi rationaalisesti.

Website Security Test