Ooit ging het om je persoonsgegevens. Je identiteit. Alterergo’s gegoten in avatars, misleidende chathandles of heus frauduleus gefröbel om geld lost te peuteren via phishing. Slimme apparaten en slimme bedrijven kunnen nu van nog iets lekkerders smullen. Nu geven we iets veel waardevollers weg: gedetailleerde info over gedrag én identiteit. Vaak onbewust, in grote hoeveelheden en voor noppes.
In de voorbereiding op een cursus Media Ethiek voor studenten van CMD Breda verdiep ik me in mijn eigen big data: twee jaar zoekgeschiedenis (meta-data) uit mijn Google Chrome browser. Want dat is waar ik het hier over heb, de meta data die onze apparaten versturen. Maar wat vind ik er eigenlijk van? Moet ik er zenuwachtig van worden? Het klinkt gevaarlijk, maar wat is het eigenlijk?
Big Data blijkt super fijn spul. Vooral om mee te ontwerpen. Jonathan Harris, mijn favoriete creative technologist en interactive artist heeft er prachtige verhalen van kunnen maken met zijn project We Feel Fine. ” We Feel Fine is an exploration of human emotion. It continually harvests sentences containing the phrase “I feel” or “I am feeling” from the Internet’s newly posted blog entries, saves them in a database, and displays them in an interactive Java applet, which runs in a web browser. Each dot represents a single person’s feeling.”
Waoooh, dat klinkt leuk. En zeker als Harris er mee aan de haal gaat. Dan wordt het betoverend mooi. En de data die hij gebruikte, in grote hoeveelheden (dus big), was gescraped van openbare bronnen. Gaat het hier dan dan over meta data? Nee.
Maar!?
Harris gebuikt gepubliceerd materiaal. Bewust gepost door een internetgebruiker. Dat is in die zin gewoon data, open en bloot voor iedereen te vinden. Meta data zijn onzichtbaar voor het surfend oog, maar wel aanwezig in de communicatie tussen e-mails bijvoorbeeld. Ze hangen ook aan je blogpost. Of tweet. Of een simpele tag over jouw adres in een database waar jij je niet van bewust bent.
En dat is waar de ethiek zijn kop opsteekt. Want die meta data is niet alleen maar fuzzy en knuffelbaar. Want…
Begin augustus troffen mijn googelende vingers het Sousveillance programma van SETUP Utrecht aan. Voor een workshop over Dirty Databases waren ze op zoek naar een gulle donateur die zijn/haar zoekgeschiedenis ten behoeve van educatie (en vermaak) op ‘de snijtafel’ zou willen leggen.
And so I did.
Als internet-grootverbruiker was ik ontzettend nieuwsgierig wat voor gevoelige informatie of interpretaties er nu uit mijn online leven konden worden getrokken. De eerste spreker van de workshop, Douwe Schmidt, had hier een mooie term voor: je digitale schaduw. Een schaduw uitgetekend door meta data. Data die iets over data zegt. ‘En vaak verklapt deze meta data meer dan de data zelf’ vervolgde Douwe. Het plaatje legt uit waarom.
Met deze visualisatie legde hij uit: ‘Dear Mom’ is wat je denkt dat je verstuurt. Maar je IP-adres is een extra pakketje dat mee verstuurd wordt. Het is meta data van je e-mail.’ Je IP adres is als een telefoonnummer. “Elke computer die is aangesloten op het internet heeft een nummer waarmee deze zichtbaar is voor alle andere computers op het internet. Om het mogelijk te maken dat computers elkaar kunnen vinden en identificeren, hebben deze hun eigen nummer nodig.” (Wikipedia, IP-adres).
Dit is hoe het internet werkt. So far so good, geen beren op de weg hier. Want zonder dit systeem bestaat er geen Internetverkeer.
Douwe houdt voor Bits of Freedom een data dagboek bij waarin hij uitzoekt wat bedrijven en overheden nu eigenlijk nog meer weten over hem op basis van meta data die hij online achterlaat.
Een jaar lang gaat hij op zoek naar alle sporen die hij online heeft achtergelaten. Op zoek naar zijn digitale alter ego. Want behalve jezelf ben je ook een adres, geboortedatum, BSN-nummer, IP-adres, zoekopdrachten, bankafschriften, bonuskaart en nog tientallen andere persoonlijke kenmerken.
Dus hoe dit nu te begrijpen: als je graag hebt dat je post niet open wordt gemaakt door de postbode, zouden we het denk ik ook fijn vinden als onze digitale post discreet behandeld wordt. Echter, dat is niet altijd zo.
Douwe deelde een persoonlijk meta-data-drama. Hij wilde een auto huren maar werd dit geweigerd omdat hij ‘niet kredietwaardig’ zou zijn. Lang verhaal kort: zijn woonadres was geflagged in de database van een bedrijf die kredietwaardigheid checkt waar het autoverhuurbedrijf gebruik van maakt. Waarom geflagged? De vorige bewonder van zijn woonadres betaalde vaak zijn rekeningen niet. Dit had dus niet zoveel te maken met Douwe zelf, maar wel zijn persoonlijke data die ‘per ongeluk’ nog gekoppeld waren aan het gedrag van de vorige bewoner. Douwe legt hier het hele verhaal uit.
Meest opvallend uit zijn blog hierover vind ik dit citaat:
‘In Nederland is te weinig bewustzijn over de effecten van dit soort bedrijven op ons leven,’ meent Pierre. In andere landen is het normaal om eens per jaar bij dit soort databoeren je dossier op te vragen. De Duitse tak van Experian verwerkt jaarlijks meer dan 1 miljoen van dit soort aanvragen op een speciaal daarvoor opgerichte afdeling.’
En dit is voor mij precies de reden waarom ik mijn data set ter beschikking heb gesteld. Hoe makkelijk (of moeilijk) is het om een gedragsprofiel van mij te maken met mijn digitale schaduw? De Correspondent en Zeit Online hebben op basis van gedetailleerdere meta data vergelijkbare projecten gedaan.
Dus, even samengevat. Meta data kunnen je gedrag in kaart brengen. Simpelweg door veel verschillende informatiepunten te combineren tot een concreter beeld van je identiteit tot en met je weekindeling, je koopgedrag, reisgedrag etc.
Douwe wilde ons vooral ook op het hart drukken dat het belangrijk is om te weten dat de wetgeving in principe voorschrijft dat we onze data mogen opvragen, net zoals in Duitsland. Hij heeft dat eens geprobeerd bij T-Mobile. ‘Ik mocht toen tien luttele dagen kiezen’. Het werd hem nota bene op a4’tjes gestuurd per post. Binnenkort dient hij een aanvraag in bij de rechtbank om een heel jaar te krijgen. Het betreft hier ook meta data gegenereerd door zijn smartphone die T-Mobile vangt via telefoonmasten, sim-kaart, abonnement etc.
In dit perspectief lijkt Google dan een heel soepele partij. Als je je zoekgeschiedenis bijhoudt dan kan je die vrij gemakkelijk terug vinden via www.history.google.com. Maar ja, is dit werkelijk alles wat ze verzamelen?
Neem een eenvoudig twitterbericht. Hoewel het minimalisme van de 140 tekens je het idee geeft dat hier toch niet veel ‘gevaarlijks’ of ‘persoonlijks’ aan zit behalve de inhoud van de boodschap toont deze visualisatie hoeveel info er meereist per tweet.
Goed, is dit nu reden om bezorgd te raken? Ja en nee. Het is bekangrijk dat je het weet. Surf bewust zou het motto dan zijn. Aan de andere kant zijn er ook heel leuke, positieve toepassingen te bedenken met twitter meta data. Bijvoorbeeld het project van Owen Mundy getiteld I Know Where Your Cat Lives om alle foto’s met de tag #cat (op social media) te mappen op Google Maps via publieke api’s (zie uitleg hier). Ook een interessante vondst is CatGrindr en dit verhaal van een developer die zijn kat (‘War Kitteh’ gedoopt) met tracking technologie uitrustte (in de halsband) om – ter vermaak – eens te checken wie van zijn buren hun wifi niet (of wel) goed beveiligd hadden. Citaat van de man zelf:
“He hopes it might make more users aware of privacy lessons those in the security community have long taken for granted. “Cats are more interesting to people than information security,” Bransfield says. “If people realize that a cat can pick up on their open Wi-Fi hotspot, maybe that’s a good thing.”
Wat hij hier blootlegt is ook aan de hand met de aankoop van Nest door Google. Deze thermostaat meet en registreert vanalles, via het wifi netwerk in je huis. Uiteraard om super slim op jouw leefpatroon af te stemmen. Da’s fijn en comfortabel. ook voor Google om nog preciezere marketing via je ip-adres jouw kant op te slingeren. Of dat vervelend is, vind ik een andere discussie. Wat ik kwalijker vind is dat het niet altijd transparant is wát ze verzamelen. Dat staat vaak niet in de handleiding. En hoe je je moet beveiligen, tegen hackers bijvoorbeeld. Zo’n Nest maakt dat inbrekers die een beetje handig zijn met wifi sniffers, zoals War Kitteh maar dan met de verkeerde intenties, precies weten wanneer je weg van huis bent.
Daarnaast, dankzij Edward Snowden is ondertussen bekend dat Google met enige regelmaat gevoelige persoonsgegevens – op te maken uit je meta data – ook aan de NSA doorsluist. En andersom, de Amerikaanse overheid luistert ook Google af. En ook de Nederlandse overheid.
En dus ook jij. Gewoon, zonder je er bewust van te zijn. En dat is wat ik onethisch vind. Bedrijven maken gebruik van onwetendheid. Idem dito overheden eigenlijk ook. Daarom is het Sousveillance programma van Setup ook zo waardevol. Om te leren wat je moet weten.
Nu veel van onze apparaten ‘slim’ zijn, en ‘slimmer worden’, is sousveillance – het tegenovergestelde van surveillance en dus een soort bottum-up spionage die je zelf in gang zet – een realiteit om eens kritisch te bestuderen.
SETUP vatte het zo samen:
Vergeet Big Brother, het zijn de Little Sisters die je in de gaten houden. In augustus verleggen we de discussie over privacy. – Dirty Databases (SETUP 2014)
En nee, natuurlijk heb je niks te verbergen. Tot er een gemenerik president, koning of premier wordt. Ja dan maakt het wel wat uit. En dat is waar je je het meest zorgen over moet maken. Over die toekomst die je niet kan voorspellen, maar wel jouw digitale schaduw mee gemoeid is.
En zo liet ik tijdens Dirty Databases mijn zoekgeschiedenis doorploegen door een groep van 15 gretige data-detectives (in spe). De opdracht was om een aantal basisgegevens over mij terug te vinden (naam, adres, opleiding, werk, geslacht etc.) en natuurlijk juicy details. Opvallende search entries (zoals hobby’s, plekken die ik vaak bezoek, gekke zoekwoorden).
De meest opvallende interpretaties van de groep:
- ik heb op katten video’s gezocht –> ik ben dus vrouw
- ik heb op babystoeltjes gezocht –> ik ben dus kinderen
- ik zoek vaak op literatuur en scripties –> ik ben student
- ik bezocht een datingsite in 2012 –> ik ben misschien nog single
- Je identiteit is heel makkelijk te achterhalen via je zoekgeschiedenis. Google weet wie je bent. Zonder moeite. Daar hebben ze je IP-adres niet voor nodig. Maak je geen illusies, zelfs de ongeoefende dataverkenner wist mijn adres, mijn werk, mijn naam, mijn opleidingsniveau, mijn mobile devices heel precies terug te vinden.
- Het interpreteren van data is tricky. Bovenstaande uitspraken waren niet alleen grof kort door de bocht, maar konden mij het leven ook echt zuur maken. Ze wisten niet dat ik aanwezig was. De data was zonder context aan de groep gegeven. Maar de kunde om een nauwgezette interpretatie te geven op basis van de data over een persoon die je niet kent….kattenfilmpjes, ya right. It takes skill.
Hadden ze meer tijd en meer ervaring, dan konden ze heel makkelijk het leven zuur maken
Zoals Douwe al aangaf met zijn autohuur-drama kunnen data tot misinterpretaties leiden. Nu vind ik het niet heel problematisch dat ze me jonger schatten en tegelijkertijd single met kinderen. Maar geen van die drie klopt. Ik zoek veel op scripties/literatuur omdat ik docent ben. Die datingsite is me een raadsel en het babystoeltje was een cadeautje voor een vriendin.
Heb ik iets te verbergen?
Nee. Ik heb geen criminele hobby’s, geen gênante collectie foto’s of extreem rechtse ideeën. Maar ik heb wel recht om te weten waar en wie er met mijn data aan de haal gaat. Zie het maar als recht op transparantie. Wat als het UWV, zorgverzekeringen en andere sociale vangnetten van dit soort big data gebruik van gaan maken?
Dan doe ik alle apparaten weg. Maar dat klinkt als een domme gebruiker die niet beter wist. Laten we ook maar zogen dat er goede wetgeving komt. Want privacy…is al een tijdje dood.
wzzzt…