tiistai 18. kesäkuuta 2013

Älä mene halpaan NSA:n avainsanalistojen kanssa

Netissä leviää listoja, joiden väitetään sisältävän NSA:n vakoilun avainsanoja. Jos sähköpostissasi esiintyy sanoja kuten CIA, terrorism tai bomb, viestisi jää tietokoneen haaviin ja joudut tarkkailuun.

Mutta hei, tämähän voidaan kääntää ympäri! Lisätään jokaisen sähköpostiviestin loppuun rimpsu vaarallisia sanoja ja tukitaan näin isonveljen tietokoneet. Eräänlainen palvelunestohyökkäys siis, toki hyvän asian puolesta.

Valitettavasti tällaiset sanalistat ovat mitä todennäköisimmin huijausta. Ei NSA:n valvonta niin alkeellista ole, että se poimisi sähköposteja yksinkertaisten avainsanojen perusteella. Netissä kiertävät sanalistat ovat muutenkin liian yleisluontoisia, jotta niillä olisi merkitystä. Eräällä näkemälläni listalla oli jopa the-artikkeli. Lisäksi jo listojen englanninkielisyys vähentää niiden hyödyllisyyttä.

Nettilistat ovatkin lähinnä moderneja hoax-varoituksia eli sähköisiä ketjukirjeitä, joissa ihmisiä pyydetään muka hyvässä tarkoituksessa välittämään viestiä eteenpäin.

Sanalistoja käytettiin 1990-luvulla kun urkinta vielä perustui puhelinten salakuunteluun. Jotain hyvin spesifisiä listoja, joilla on esimerkiksi projektien koodinimiä tai kemiallisten yhdisteiden kaavoja, saatetaan käyttää vieläkin, mutta yleisillä pommi- tai terrorismi-sanoilla ei ole merkitystä.

Sanalistat ovat hyödyttömiä senkin vuoksi, että hyökkääjät osaavat käyttää kiertoilmaisuja. 9/11-terroristit käyttivät jopa kahdenkeskisissä keskusteluissa yliopiston tiedekuntien nimiä viittaamaan iskujen kohteisiin. Laki merkitsi Capitol-kukkulaa ja niin edelleen.

Itse asiassa kyseiset terroristit eivät lähettäneet sähköposteja lainkaan: he kirjoittivat viestejä Hotmailiin, mutta vastaanottaja kävi lukemassa ne lähettäjän tunnuksilla, joten viestiä ei voinut missään vaiheessa kaapata. Tässä onkin yksi syy siihen, miksi NSA haluaa pääsyn suoraan nettipalvelujen tiedostoihin.

Todennäköisesti NSA:n valvonta perustuu enemmänkin viestiliikenteen määrän ja henkilöiden välisten verkostojen seurantaan. Sosiaalinen media on tehnyt siitä helppoa. Suomalaisetkin yritykset käyttävät verkostoanalyysiä halutessaan tietää, miten informaatio kulkee henkilöltä toiselle ja mitä käyttäjät todella ajattelevat yrityksen tuotteista.

Twitterin seuraaminen on jopa liiankin helppoa. Runsas vuosi sitten kahdelta brittiteiniltä evättiin pääsy USA:han, koska he olivat pilamielessä twiitanneet "destroy America" ennen matkaansa. Ilmeisesti jollain turvaorganisaatiolla on todella käytössä avainsanoihin perustuva tarkkailulista -- uutisessa kuvatuin koomisin seurauksin. Ehkä tässä oli kuitenkin kyse jostain oudosta sattumasta, muutoin saisimme lukea vastaavia uutisia päivittäin.

Lopuksi herää kiero ajatus: ehkä netissä kiertävät listat todella ovat peräisin NSA:lta -- viestit, joissa on useita avainsanoja peräkkäin, ovat taatusti vaarattomia ja tietokone voi hypätä niiden yli. Juju on siinä, että black listin sijaan kyseessä onkin white list.

Lisäys 10.7.2013: Tässä aihetta sivuava, kiinnostava juttu: http://techcrunch.com/2013/07/08/play-with-an-mit-tool-that-visualizes-how-the-nsa-can-map-your-relationships/

9 kommenttia:

Unknown kirjoitti...

Ihan totta.
Ei kannata noin vain innostua laittelemaan sanoja viesteihin vaikka aivan ilmeisesti vääristä kommenteista saattaa tulla ongelmia.
Suomen kieli taitaa olla aika vaaraton. (Kovin moni mahdollinen terroristi ei vielä osaa)

Onkohan IMessage kuitenkin täysin turvallinen kommunikaatioon?

Skype oli ennen kuin Microsoft osti sen. Saksan tiedustelu aikoinaan moitti ettei pysty seuraamaan Skype. Enään ei semmoista ole kuulunut.

Mitenkä mahtaa olla vaikka Saunalahden postin kanssa. Voiko sitä ulkomailta seurata?

Petteri Järvinen kirjoitti...

Olikin varsin sopivaa, että juuri Microsoft osti Skypen. Näin NSA sai ainakin mahdollisuuden salakuunteluun. Jos yhtiö olisi pysynyt eurooppalaisena tai myyty Venäjälle, tilanne olisi ollut ihan toinen.

Mistä herääkin jatkokysymys: saiko Microsoft apua NSA:lta kauppoja hieroessaan? On USA:n ja NSA:n kansallinen etu, että maan omat nettiyhtiöt menestyvät.

Anonyymi kirjoitti...

Aivan viime päivinä on tämän jutun tiimoilta herätty huomaamaan EUn sisäisten pilvi- ja kommunikaatiopalveluiden etuja. Mielestäni tämä on tärkeä seikka ja jos kaikki menee putkeen sillä voi olla kauaskantoisiakin vaikutuksia. Esimerkiksi EUssa on tähän asti oltu liian hyväuskoisia Googlen ja Facebookin yms. palvelinfarmien perustamisen suhteen. Jatkossa niille on asetettava kovemmat vaatimukset tietojen keruun ja hyväksikäytön osalta. USAn National Stasi Agency (NSA) ei saa täällä kerätä yksittäisille ihmisille kuuluvaa dataa, ei edes metadataa, koska se on täällä, toisin kuin USAssa, laitonta. Tämä on varmistettava politiikan keinoin.

Jo useamman vuoden on tihkunut tietoja yksittäisistä eurooppalaisista henkilöistä, joilta yhtäkkiä ilman selityksiä on evätty USAn viisumi tai viety maahan saavuttaessa suoraan kuulusteltavaksi. Itse uskon, että tämänkaltainen juridinen painajainen on seurausta metadatan troolaamisesta. NSAn tietokannoista yksinkertaisesti pinpointataan potentiaalinen pahis X ja sitten ajetaan sql kysely metadatasta kenellä kaikilla henkilöillä on joskus ollut jokin yhteys ko. henkilöön ja varmuuden vuoksi kaikki laitetaan valvottavien/kuulusteltavien listalle. Yksittäisen ihmisen oikeuksien kannalta tilanne on nyt juuri sen kaltainen katastrofi kuin Snowden haluaa väittää. Etenkin kun kyselyjä saa Snowdenin mukaan tehdä NSAssa ja sen ulkopuolella melkeinpä kuka tahansa ilman mitään rajoituksia. USA käyttää erityisasemaansa internetin topografiassa härskisti väärin. Tähän on tultava loppu vaikka vakoilu ei siihen lopukaan.

Anonyymi kirjoitti...

"Itse asiassa terroristit eivät lähettäneet sähköposteja lainkaan: he kirjoittivat viestejä Hotmailiin, mutta vastaanottaja kävi lukemassa ne lähettäjän tunnuksilla, joten viestiä ei voinut missään vaiheessa kaapata."

Tämähän taitaa olla jo jonkinlainen klassinen ratkaisu, eikös samaa metodia käyttänyt myös potkut saanut CIA-pomo Petraeus viestitellessään rakastajattarensa kanssa.

"Destroy America" ei ollut edes mikään teorristipila, vaan ymmärtääkseni teinikieltä lontooksi ja tarkoittaa rajua bilettämistä. Esimerkki varmaan juuri siitä miksi yksinkertaiset sanalistasysteemit eivät varmaan toimi.

jaska kirjoitti...

Uskoisin, että julkisen internetin seurannassa vieläkin käytetään avainsanalistoja, jos sellaista ylipäätään tehdään. Tuskin sentään kovin laajasti niin yksinkertaisella logiikalla kuin tuossa vuoden takaisessa esimerkissä.

Kielen merkityksen koneellisessa ymmärtämisessä ei olla vielä kovin pitkällä ja julkisen internetin seuraaminen on valtava urakka. Luultavasti ainakin karkein seulonta tapahtuu avainsanoihin perustuen.

Jari kirjoitti...

On ihan fiksua pohtia sitä, miten ihminen ja tietokone/tekoäly näkee kielen.

"Ei NSA:n valvonta niin alkeellista ole, että se poimisi sähköposteja yksinkertaisten avainsanojen perusteella."

Eihän kyse ole vain NSA:n alkeellisuudesta.

Ehkä kyse on ennemmin ihmiskielen alkeellisuudesta. Jokin fanaattinen, huonolla englannilla kommunikoiva ryhmä ei liioin käytä kiertoilmaisuja eikä heidän puheensa ole monimutkaista. Jos he osaisivat toimia verbaalisti, niin he ratkaisisivat ongelmat puhumalla, eikä heillä olisi mitään syytä ryhtyä väkivaltaan.

Kun meille syötetään viihdeohjelmien kautta simppeliä englanninkieltä, meitä on helppo seurata.

Jaska: "Kielen merkityksen koneellisessa ymmärtämisessä ei olla vielä kovin pitkällä"

Kyllä, ja tämä ymmärtäminen ei ole tekoälyn ongelma, vaan ihmisen ja koneen keskinäinen ongelma. Miten saada terroristi ja kone ymmärtämään toinen toisiaan?

Petteri Järvinen kirjoitti...

Jos he osaisivat toimia verbaalisti, niin he ratkaisisivat ongelmat puhumalla, eikä heillä olisi mitään syytä ryhtyä väkivaltaan.

Jokseenkin länsimainen näkemys, aivan kuin lähi-idän konfliktissa olisi kyse vain keskustelun puuttumisesta. USA:n omakin neuvotteluhalukkuus on kovin vähäistä, kun takana on ylivoimainen sotilasmahti.

Anonyymi kirjoitti...

@Petteri

Olen samaa mieltä, USA:n ja koalition heikosta halukkuudesta neuvotella.

9/11 tapahtumien myötä Jenkit olivat niin sokeita, että ne lankesivat lähes samaan anaan, kuin se itse CIA:n Mujjahedien rahoittamisella auttoi tekemään Neuvostoliitolle ts. se onnisuttiin sitomaan liian kalliiksi käyvään sotaan.

Lännellä on kestänyt kovin kauan ymmärtää Talebanien käyttämä (arabien) sanonta "Teillä on kellot, mutta meillä on aika".

Epäonnistumisen katkera kalkki on epäilemättä vaikeaa niellä.

Anonyymi kirjoitti...

Tässä linkissä on metadatan käyttö NSA:n johtajan Keith Alexanderin tänään kuvaamana.

http://qz.com/95719/heres-how-metadata-on-billions-of-phone-calls-predicts-terrorist-attacks/

Homma tapahtuu juuri niin kuin olin ylempänä arvellutkin. Mitään überanalyyttisia profiiliajoja ei kantoihin tehdä eikä emaileja lueta tai puheluja kuunnella. NSA vain tallentaa kaiken metadatan maailman kaikesta tietoliikenteestä isoon kantaan ja kun jostain saadaan vinkki 'terroristista' niin ko. henkilön IP-osoitteen, meiliosoitteen ja puhelimen tunnisteen relaatiot muiden henkilöiden metadataan selvitetään tietokannasta; kenelle on soitettu tai meilattu, kuka on soittanut tai meilannut tai chatannut tai kommentoinut blogia, koska, missä ja milloin. Keiden kanssa nämä ensimmäisen tason relaatiot puolestaan ovat vaihtaneet tietoje jne. Tämä kaikki vie noin millisekunnin. Kaikki nämä relaatiohenkilöt ovat NSA:n silmissä potentiaalisia pahiksia ja tarkkailulistoilla, ennen kuin heitä on edes syytetty mistään.

Six degrees of separation sääntö kertoo statistisesti, että useat tämänkin blogin lukijoista ovat jo jonkun NSA:n mielestä pahiksen - otetaan nyt vaikka Assange tai Kim Dotcom esimerkiksi - relaatioita tavalla tai toisella.