Mijn digitale schaduw


Als het gaat om technologie worden romans en films die gisteren nog science fiction waren vandaag al ingehaald door de werkelijkheid. Zoals in het geval van profielen die gemaakt worden aan de hand van big data. Wat ontdek je over jezelf als je je zoekgeschiedenis laat analyseren?

In de voorbereiding op een cursus Media Ethiek voor studenten van CMD Breda verdiep ik me in mijn ‘eigen’ big data. We lezen er veel over en moeten vaak begrijpen dat commerciële bedrijven er geld aan verdienen of dat overheden er strategische keuzes op baseren. Maar dat klinkt zo abstract. Is big data iets wat ik zelf ook kan aanraken? Wat moet ik er eigenlijk van vinden, behalve me zorgen maken?

googleOm die reden heb ik twee jaar zoekgeschiedenis uit mijn Google Chrome-browser gedoneerd aan de workshop Dirty Databases van SETUP Utrecht, onderdeel van het Sousveillance Summer School-programma dat van augustus tot september liep. In tegenstelling tot surveillance is sousveillance bottom-up-spionage die je zelf in gang zet. Of eigenhandige zelfregistratie, zoals Wikipedia het noemt. Mijn zoekgeschiedenis is daar een voorbeeld van. Een rijke verzameling zoekwoorden en websites. Maar vooral big genoeg om gedragspatronen, en dus een authentiek profiel uit op te maken.

Nu het zelfregistreren van ons gedrag zo alledaags is geworden – denk aan stappentellers, thermostaat-instellingen, fiets- en hardloop-apps – is sousveillance iets om eens kritisch te bestuderen. SETUP vatte het zo samen:

Vergeet Big Brother, het zijn de Little Sisters die je in de gaten houden.

Ik wilde weten, als achteloze consument: wat vertelt mijn database nu eigenlijk? Ten behoeve van educatie (en vermaak) wilde ik mijn onwetendheid op ‘de snijtafel’ leggen.

And so I did.

De zwarte spiegel

De andere deelnemers aan de workshop waren ook onwetend. Ze wisten niet dat de donateur van de dataset ook aanwezig was. De eerste les die ik leerde terwijl er vijftien amateur-data-analisten mijn zoekgeschiedenis doorzochten, is dat het ook daadwerkelijk voelt alsof er iemand in je leven aan het browsen is. Dat voelt spannend, maar ook erg ongemakkelijk. Naakt. Even schoot een gedachte door mijn hoofd: ‘Oh shit, misschien heb ik wel iets vreemds gegoogeld vorig jaar, maar weet ik het niet meer wat’. Snel probeerde ik porno als zoekwoord in de op maat gemaakte interface – door workshopleider Heinze Havinga – voor mijn dataset. Gelukkig niets.

 Dus wat is mijn zoekgeschiedenis eigenlijk behalve een archief? Een echo, een spiegel van twee jaar online leven. Een hoogst persoonlijk zoekpatroon. Toen internetaanbieder AOL in 2006 per ongeluk 650.000 zoekprofielen lekte op internet, hebben filmmakers Lernert Engelberts en Sander Plug een serie filmpjes gemaakt naar aanleiding van het zoekprofiel van één persoon: ‘user #711391’. De serie ‘minimovies’, I Love Alaska, vertelt het verhaal van een zwaarlijvige vrouw van middelbare leeftijd die in de menopauze zit en haar seksleven wat wil oppeppen.

Mijn eigen verhaal zou worden getypeerd door Hollywood blondes en snackcorner Zuilen. Want met gemak, zo blijkt, viel de ongeoefende data-detectives mijn intensieve zoektochten naar acterende blondines (voor een artikel) en mijn grote voorliefde voor de openingstijden van de snackcorner om de hoek op, waar ik mijn patatjes haal in de wijk op de luie zondagavond. Triomfantelijk riep de vinder: ‘Oh, ze snackt wel vaak!’ Niets crimineels, of zorgelijks. Althans, als dit niet tegen me wordt gebruikt. Dan kan zelfs welk patatje ik bestel bij de patatzaak ineens interessant worden. Kleine kanttekening: ik snack niet vaak, maar de database van zoekwoorden bevatte wel enige glitches waardoor sommige zoekopdrachten wat vreemd gebundeld en in overdreven proporties aan de workshoppers werden getoond. Ziehier, ik wil me meteen verdedigen.

Afluisteren

Terwijl ik mij verwonder over welke verhalen er over mijzelf in een database schuilen die ik nota bene zelf heb opgebouwd door klakkeloos te googelen, moet ik denken aan de film Enemy Of The State. Will Smith in de rol van een naïeve advocaat, Robert Dean, die door een corrupte politicus de schuld in de schoenen wordt geschoven van een smerige moord en non-stop in de gaten gehouden en opgejaagd wordt door de geheime dienst NSA.  Robert wordt in de lift door een surveillance-expert gefouilleerd, die allerhande afluisterapparatuur uit zijn mobiele telefoon, schoen en pen tevoorschijn haalt. In deze fictieve, maar toch realistische weergave van de wereld toonde regisseur Tony Scott dat de NSA nog enigszins haar best moest doen om mensen te bespioneren. De mobiele telefoon maakte het al een stuk makkelijker.

Dit was 1998. Ik zat in de brugklas en was de koning te rijk met mijn eerste mobiele telefoon. Maar de consequenties van zo’n apparaat? Daar ben ik me nu pas van bewust, nu we twintig stappen verder zijn met slimmere apparaten.

Hoewel de film Das Leben der Anderen nog steeds waardevolle lessen bevat over hoe een maatschappij omgaat met technologie in tijden van oorlog, is dit beeld, net als Enemy Of The State, ondertussen romantiek: een man op zolder die voor de Oost-Duitse overheid in de jaren 1940 een sleutelfiguur dag in dag uit afluistert. Nee wij, consumenten en burgers, kopen nu vrijwillig onze eigen surveillance. En tot op zekere hoogte dient het ook ons gemak.

Maar dat is een narratief dat de producenten van deze apparaten ons maar al te graag laten geloven. Ondertussen doen filmmakers hun best ons de keerzijde van de werkelijkheid te tonen. Er zijn science fiction-series die ons met de neus op de hedendaagse feiten drukken. We versmaden ze als entertainment, maar het zijn waardevolle lessen die je serieus mag nemen. En die lessen gaan niet over de verre toekomst, maar de reeds ontwikkelende toekomst. Ergens tussen nu en morgen.

Wie beter wil begrijpen waar internetpessimist Evgeny Morozov tegen ageert – het wollige utopisme dat het internet de mensheid zal redden/verbeteren etcetera – kan naast het lezen zijn boeken The Net Delusion (2011), To Save Everything Click Here (2013) en zijn blog voor Slate.com ook gerust een paar weekenden binge watchen met de series Person Of Interest van Jonathan Nolan en Black Mirror van Charlie Brooker. Beide series zijn begonnen in 2011, en zijn redelijke pogingen ons wat te leren, via vermaak, over onze naïeve blik op technologie.

 Nolan neemt de Batman-aanpak van zijn broer Christopher door artificial intelligence centraal te zetten in de serie als gadget om slachtoffers van overheidsrancune te redden. Actie en vlotte oneliners zijn bijgeleverd, maar Person Of Interest is niet alleen vermakelijk. De serie schetst ook een treffend beeld van wat nu werkelijkheid is: hoe alom aanwezige apparaten samen een groter systeem vormen voor surveillance en fraude.

Brooker neemt in Black Mirror een sociale invalshoek. Door kleinmenselijke conflicten uit te spelen in een hoogst technische leefomgeving toont hij hoe onze interacties met elkaar subtiel evolueren naar vreemde onmenselijkheid. In een aflevering in het eerste seizoen krijgt een stel bijvoorbeeld ruzie over de oude liefde van de vrouw. Dankzij de implantaten in het oog registreren ze alles van hun dagelijks leven. Zelfs hun baby heeft er een. Zo kunnen ze niet alleen de oppas controleren door de ‘babyfeed’ terug te kijken, ook haar geheimpjes worden dankzij het archief door haar man moment voor moment uitgeplozen. Doordat onze levens tot op de seconde doorzoekbaar zijn, verliest het paar de kans om de relatie te repareren door een simpele menselijke eigenschap: vergiffenis. Dat is in Black Mirror de consequentie van het comfort van life-logging.

Big Data

Ieder gereedschap heeft de potentie van goed en slecht. Hamer of big data, het hangt er vanaf hoe je het gebruikt. Data-visionair Hans Rosling heeft met zijn pleidooi voor de wasmachine als beste uitvinding van de eeuw een sterk punt gemaakt voor de welvaart en groei in opleidingsniveau van een hele generatie. De technologie maakte ruimte voor meer aandacht voor kinderen, boeken voorlezen en de zelfontplooiing van vrouwen. Wat dat betreft lijkt technologie ook echt wat op te lossen.

Afbeelding van We Feel Fine

Big data blijkt ook super fijn spul om mee te ontwerpen. Jonathan Harris, mijn favoriete creative technologist en interactive artist, heeft er prachtige verhalen van kunnen maken met zijn project We Feel Fine. Harris richtte een website in die stukken tekst met de trefwoorden ‘I feel’ of ‘I am feeling’ oppikt uit openbare blogposts.

We Feel Fine is an exploration of human emotion. It continually harvests sentences and displays them in an interactive Java applet, which runs in a web browser. Each dot represents a single person’s feeling.

Waoooh, dat klinkt leuk. En zeker als Harris er mee aan de haal gaat. Dan wordt het betoverend mooi. Zijn interactieve visualisatie toont menselijk gedrag op haar meest poëtisch. Bovendien geeft hij inzicht in hoe hij technologie inzet om zijn verhaal te vertellen. Aspirant-internetkunstenaars en designers kunnen van hem leren.

Metadata

Echter, om te snappen hoe internet werkt en wat nu precies wringt in Facebooks verdienmodel is het handig om te begrijpen wat het verschil is tussen de data die Harris verzamelt en metadata. Het eerste is openbaar: je statusupdate. Je tweet. Het tweede – metadata – is ‘onzichtbaar’ voor het surfend oog, maar wel aanwezig in de communicatie tussen e-mails en hangt ook aan je blogpost. Of tweet. Of een simpele tag over jouw adres in een database waar jij je niet van bewust bent. Met metadata kun je leren bewuster om te gaan. Je kunt je smartphone bijvoorbeeld rooten en daardoor je anonimiteit terug claimen door reclames in apps te kunnen blokkeren.

En dit is waar de ethiek de kop opsteekt. Want dit soort mogelijkheden worden niet in de gebruiksaanwijzingen gegeven. Daarvoor moet je begeven op nerd-gebied en ook echt wat weten over hoe de technologie werkt. Maar waar leren we dat? Want je wist waarschijnlijk ook niet dat die metadata, waarmee je online surfgedrag bestudeerd kan worden, ook worden gebruikt om drone-aanvallen te plotten? Voormalig hoofd van de NSA en de CIA, Michael Hayden, gaf dit jaar zonder blikken of blozen toe dat de Amerikaanse overheid ‘will kill people based on meta data’. Lees hier en hier verder als je beter wil begrijpen hoe de NSA dit doet.

Nee, metadata zijn niet alleen maar fuzzy en knuffelbaar.

 De eerste spreker van de workshop Dirty Databases was Douwe Schmidt. Hij had er een mooie term voor: je digitale schaduw. Een schaduw uitgetekend door metadata. Data die iets over data zeggen. ‘En vaak verklappen deze metadata meer dan de data zelf’, vervolgde Douwe. Met een visualisatie legde hij het uit: ‘‘Dear Mom’ is wat je denkt dat je e-mailt. Maar je IP-adres is een extra pakketje dat mee verstuurd wordt. Het is metadata van je e-mail.’ Je IP adres is als een telefoonnummer. Zoals Wikipedia het uitlegt: ‘Elke computer die is aangesloten op het internet heeft een nummer waarmee deze zichtbaar is voor alle andere computers op het internet. Om het mogelijk te maken dat computers elkaar kunnen vinden en identificeren, hebben deze hun eigen nummer nodig.’ Dit is hoe internet werkt. So far so good, geen beren op de weg. Want zonder dit systeem bestaat er geen internetverkeer.

Douwe houdt voor Bits of Freedom, een burgerrechtenbeweging die opkomt voor vrijheid en privacy op internet, een datadagboek bij waarin hij uitzoekt wat bedrijven en overheden nu eigenlijk nog meer weten over hem op basis van metadata die hij online achterlaat.

‘Een jaar lang gaat hij op zoek naar alle sporen die hij online heeft achtergelaten. Op zoek naar zijn digitale alter ego. Want behalve jezelf ben je ook een adres, geboortedatum, BSN-nummer, IP-adres, zoekopdrachten, bankafschriften, bonuskaart en nog tientallen andere persoonlijke kenmerken.’ (Data Dagboek, BOF.nl)

Dus hoe dit nu te begrijpen: als je graag hebt dat je post niet open wordt gemaakt door de postbode, zou je het denk ik ook fijn vinden als onze digitale post discreet behandeld wordt. Echter, dat is niet altijd zo.

Douwe deelde een persoonlijk metadata-drama. Hij wilde een auto huren, maar werd dit geweigerd omdat hij ‘niet kredietwaardig’ zou zijn. Lang verhaal kort: zijn woonadres was geflagged in de database van een bedrijf die kredietwaardigheid checkt waar het autoverhuurbedrijf gebruik van maakt. Waarom was het geflagged? De vorige bewoner van zijn woonadres betaalde vaak zijn rekeningen niet. Het had dus niets te maken met Douwe zelf, maar met zijn persoonlijke data die ‘per ongeluk’ nog gekoppeld waren aan het gedrag van de vorige bewoner.

Meest opvallend uit zijn blog vind ik dit citaat:

‘In Nederland is te weinig bewustzijn over de effecten van dit soort bedrijven op ons leven,’ meent Pierre. In andere landen is het normaal om eens per jaar bij dit soort databoeren je dossier op te vragen. De Duitse tak van Experian verwerkt jaarlijks meer dan 1 miljoen van dit soort aanvragen op een speciaal daarvoor opgerichte afdeling.’

 En dat is voor mij precies de reden waarom ik mijn dataset ter beschikking heb gesteld. Hoe makkelijk (of moeilijk) is het om een gedragsprofiel van mij te maken met mijn digitale schaduw?

Dus, even samengevat: metadata kunnen je gedrag in kaart brengen. Simpelweg door veel verschillende informatiepunten te combineren tot een concreter beeld van je identiteit tot en met je weekindeling, je koopgedrag, reisgedrag etc. Je Facebookfeed is daar een vernuftige uitwerking van. De algoritmes die je tijdlijn vormgeven reageren op jouw gebruikersprofiel die steeds rijker en genuanceerder wordt naarmate je het intensiever gebruikt.

Wetgeving

Douwe wilde ons vooral ook op het hart drukken dat het belangrijk is om te weten dat de wetgeving in principe voorschrijft dat we onze data mogen opvragen. Hij heeft dat eens geprobeerd bij T-Mobile. ‘Ik mocht toen tien luttele dagen kiezen.’ Het werd hem nota bene op A4’tjes gestuurd per post. Binnenkort dient hij een aanvraag in bij de rechtbank om een heel jaar te krijgen, want volgens Europese wetgeving heeft hij daar recht op. Het betreft hier ook metadata gegenereerd door zijn smartphone die T-Mobile vangt via telefoonmasten, simkaart, abonnement etcetera.

In dit perspectief lijkt Google dan een soepele partij. Als je je zoekgeschiedenis bijhoudt, kun je die vrij gemakkelijk terug vinden via www.history.google.com. Maar ja, is dit werkelijk alles wat ze verzamelen? Neem bijvoorbeeld een eenvoudig twitterbericht. Hoewel het minimalisme van de 140 tekens je het idee geeft dat hier toch niet veel ‘gevaarlijks’ of ‘persoonlijks’ aan zit behalve de inhoud van de boodschap, toont deze visualisatie hoeveel info er meereist per tweet:

map-of-a-tweet
Goed, is dit nu reden om bezorgd te raken? Ja en nee. Het is belangrijk dat je het weet. Surf bewust, zou het motto dan zijn. Er zijn er ook heel leuke, positieve toepassingen te bedenken met Twitter-metadata. Bijvoorbeeld het project van Owen Mundy getiteld I Know Where Your Cat Lives om alle foto’s met de tag #cat (op social media) te mappen op Google Maps via publieke api’s.

 Ook een interessante vondst is dit verhaal van een developer die zijn kat War Kitteh met tracking technologie uitrustte (in de halsband) om – ter vermaak – eens te checken wie van zijn buren hun wifi al dan niet goed beveiligd hadden. Citaat van de man zelf:

He hopes it might make more users aware of privacy lessons those in the security community have long taken for granted. ‘Cats are more interesting to people than information security’, Bransfield says. ‘If people realize that a cat can pick up on their open Wi-Fi hotspot, maybe that’s a good thing.’

Wat hij hier blootlegt is ook aan de hand met de aankoop van Nest door Google. Deze thermostaat meet en registreert van alles, via het wifi-netwerk in je huis. Uiteraard om de verwarming superslim op jouw leefpatroon af te stemmen. Da’s fijn en comfortabel. ook voor Google om nog preciezere marketing via je IP-adres jouw kant op te slingeren. Of dat vervelend is, vind ik een andere discussie. Wat ik kwalijker vind, is dat het niet altijd transparant is wát ze verzamelen. Dat staat vaak niet in de handleiding. En hoe je je moet beveiligen, tegen hackers bijvoorbeeld. Zo’n Nest maakt dat inbrekers die een beetje handig zijn met wifi sniffers, zoals War Kitteh maar dan met de verkeerde intenties, precies weten wanneer je weg van huis bent.

Daarnaast is, dankzij Edward Snowden, ondertussen bekend dat Google met enige regelmaat gevoelige persoonsgegevens – onder meer opgemaakt uit je metadata – aan de NSA doorsluist. En andersom, de Amerikaanse overheid luistert ook Google af, en ook de Nederlandse overheid. En die op haar beurt ook weer andere onwetende partijen.

En nu jij ook. Jij doet er zelf ook aan mee, vrijwillig informatie genereren over je privéleven voor andermans gewin. Door onwetend internetgebruik. En dat is wat ik onethisch vind. Bedrijven en overheden maken gebruik van je naïviteit. Zolang een consument niet daadwerkelijk en volledig kan begrijpen wat het apparaat in wezen is en doet… Moet er niet degelijke voorlichting zijn?

Daarom is het Sousveillance-programma van Setup ook zo waardevol. Om te leren wat je moet weten.

Babystoeltjes

En zo liet ik tijdens Dirty Databases mijn zoekgeschiedenis doorploegen door een groep gretige data-detectives (in spe). De opdracht was om een aantal basisgegevens over mij terug te vinden (naam, adres, opleiding, werk, geslacht etcetera) en natuurlijk juicy details: opvallende zoekopdrachten – zoals hobby’s, plekken die ik vaak bezoek, gekke zoekwoorden.

De meest opvallende interpretaties van de groep:

• Ik heb op kattenvideo’s gezocht –> ik ben dus vrouw
• Ik heb op babystoeltjes gezocht –> ik heb dus kinderen
• Ik zoek vaak op literatuur en scripties –> ik ben student
• Ik bezocht een datingsite in 2012 –> ik ben misschien nog single

Wat ik hiervan heb geleerd:

• Je identiteit is heel makkelijk te achterhalen via je zoekgeschiedenis. Google weet wie je bent. Zonder moeite. Daar hebben ze je IP-adres niet voor nodig. Maak je geen illusies, zelfs de ongeoefende dataverkenner wist mijn adres, mijn werk, mijn naam, mijn opleidingsniveau, mijn mobile devices heel precies terug te vinden.

• Het interpreteren van data is tricky. Bovenstaande uitspraken waren niet alleen grof kort door de bocht, maar zouden mij het leven ook echt zuur kunnen maken. Ze wisten niet dat ik aanwezig was. De data was zonder context aan de groep gegeven. Maar de kunde om een nauwgezette interpretatie te geven op basis van de data over een persoon die je niet kent…. Kattenfilmpjes, ya right. It takes skill.

Zoals Douwe al aangaf met zijn autohuur-drama kunnen data tot misinterpretaties leiden. Nu vind ik het niet heel problematisch dat ze me jonger schatten en tegelijkertijd single met kinderen. Maar geen van die drie klopt. Ik zoek veel op scripties en literatuur omdat ik docent ben. Die datingsite is me een raadsel en het babystoeltje was een cadeautje voor een vriendin.

Heb ik iets te verbergen?

Nee. Tot er een gemenerik president, koning of premier wordt. Ja, dan maakt het wel wat uit. En dat is waar je je het meest zorgen over moet maken. Over die toekomst die je niet kan voorspellen, maar waar wel jouw digitale schaduw mee gemoeid is. Ik heb geen criminele hobby’s, geen gênante collectie foto’s of extreem rechtse ideeën. Maar ik heb wel het recht om te weten waar en wie er met mijn data aan de haal gaat.

Zie het maar als recht op transparantie. Wat als het UWV, zorgverzekeringen en andere sociale vangnetten van dit soort big data gebruik gaan maken? Dan doe ik alle apparaten weg. Maar dat klinkt als een domme gebruiker die niet beter wist. Laten we ook maar zorgen dat er goede wetgeving komt.

Want privacy… is al een tijdje dood.

© Schift, oktober 2014

Share Button
NIENKE HUITENGA Geschreven door:

Wees de eerste om te reageren

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.