Waarom Cambridge Analytica een vergiftigde erfenis achterlaat

[Analyse] Cambridge Analytica mag dan misschien wel als bedrijf niet meer voortbestaan, haar nalatenschap laat zich nog steeds voelen. De illustere data die in 2014 werden verzameld en in 2015 weer werden verwijderd, zijn vandaag verankerd in wijdverspreide datasets.

 

Facebook en databeveiliging, het schijnt niet altijd goed samen te gaan. Dat was ook de mening van het Europees Parlement, toen het Facebook-wizard Mark Zuckerberg op 22 mei ontbood op een publieke hoorzitting om zich te verantwoorden omtrent het grootschalige datalek van een slordige 80 miljoen Facebookgebruikers, waaronder 61.000 Belgen.

 

Een schijnvertoning

 

Zuckerberg gaf grif toe dat hij niet genoeg heeft gedaan ter bescherming van de miljoenen Facebook accounts waarvoor hij – als geestelijke vader – indirect verantwoordelijk voor is. Mark Zuckerberg is een publiek figuur en moet er dan ook alles aan doen om zijn imago en dat van zijn miljoenenbedrijf in stand te houden. Facebook bracht daarom ook inderhaast een nieuwe tool uit waarbij je kan zien of je accountgegevens werden gebruikt door het inmiddels illustere Cambridge Analytica. Zo wenst de social media-gigant, ook in navolging van de GDPR, een antwoord te bieden aan kritiek op het gebrek aan transparantie. Volgens Facebook werden de gegevens van zo’n 87 miljoen personen gebruikt.

 

Het vormt een mooie aanvulling op zijn verschijningen in het Amerikaanse congres en het Europees Parlement, al ging die laatste waarschijnlijk niet even smooth als hij zelf geanticipeerd had. Zo legden de Europese fractieleiders hem het vuur danig aan de schenen. “Zouden er misschien nog wel meer schandalen aan het licht komen?” vroegen ze zich luidop af. De Europese liberale fractieleider Verhofstadt spande daar echter de kroon met eentje die intussen rijp is voor de geschiedenisboeken; “Wilt u herinnerd worden als het genie dat een digitaal monster heeft gemaakt?” Een zware aantijging, maar misschien kan de schuld niet enkel bij Facebook gelegd worden.

 

Hoe het allemaal begon

 

De zogenaamde “Cambridge Analytica data” werden immers verzameld door Global Science Research, een klein bedrijfje van de inmiddels beruchte kwantitatief psycholoog aan Cambridge University, Aleksandr Kogan. Kogan verzamelde de data voor SCL, het moederbedrijf van Cambridge Analytica. Hij stelde hiervoor in 2014 een persoonlijkheidsquiz op genaamd ‘thisisyourdigitallife‘. De quiz werd gepubliceerd op Facebook en wou zo toegang verkrijgen tot de gegevens van de 270.000 Facebookgebruikers die aan de quiz hadden deelgenomen. Daarop combineerde Cambridge Analytica deze data met andere datasets en –modellen. Dat leverde op zijn beurt dan weer de proxyprofielen van miljoenen stemgerechtigden in de VS op, die werden gebruikt in de verkiezingscampagne voor Trump in 2016.

 

De techniek van Kogan is eigenlijk een verderzetting van de klassieke psychologietesten; Kogan maakte namelijk gebruik van psychometrische testen waarbij de respondenten steeds ‘hoog’ of ‘laag’ kunnen scoren op ‘de grote 5 persoonlijkheidskenmerken’, met name extraversie, servicegerichtheid, emotionele stabiliteit, zorgvuldigheid en openheid voor nieuwe ervaringen. Cambridge Analytica paste daarna op die gegevens kunstmatige intelligentie-algoritmen toe om correlaties te leggen tussen deze kenmerken en het facebookgedrag van individuele gebruikers.

 

Een oranje addertje onder het gras

 

Hoewel er dus vaak ophef wordt gemaakt rondom de gelekte data in se, schuilt hier het addertje onder het gras. Het zijn net de gedragsmodellen die Cambridge Analytica van die data heeft afgeleid, waarin het grootste gevaar voor databeveiliging zit. Wanneer die modellen dan ook nog eens worden toegepast op politieke campagnes, blijken de datasets zeer efficiënt. De Amerikaanse president Trump stelde een paar maanden voor zijn overwinningsslag bij de verkiezingen de CEO van Cambridge Analytica, Alexander Nix, aan als zijn digital campaign manager. Een slimme zet, die hem ook nog eens de titel van machtigste man ter wereld opleverde. En dan te bedenken dat de 70-jarige Trump helemaal niet zo digitaal onderlegd is – naar goede bronnen is er zelfs geen enkele computer te bespeuren op zijn bureau.

 

Toen Nix de Trump-campagne onder handen nam, maakte die een immense ommezwaai. Plots steunde de campagne op intensief onderzoek, datamodellering en prestatie-optimaliserende algoritmen om zo 10.000 advertenties af te stemmen op verschillende doelgroepen in de maanden die voorafgingen aan de presidentsverkiezingen. Volgens een 27-pagina tellende presentatie van voormalige Cambridge Analytica-werknemers die het nauwst aan de Trump-campagne hadden gewerkt, werden de advertenties zelfs miljarden keren bekeken.

 

Kunstmatige intelligentie?

 

Trump had inderdaad een dringende behoefte aan een degelijke data-geleide politieke campagne. Voor hij immers met Cambridge Analytica in zee ging, had hij volgens het document zelfs “geen enkele noemenswaardige data-infrastructuur” en “geen uniforme data-, digitale of technologiestrategie”, “noch een digitaal marketingteam”. Dat was begin juni 2016. In november 2016 werd hij verkozen tot president van de Verenigde Staten. Of hoe een doorgedreven digitale marketingstrategie wel degelijk een verschil kan maken.

 

Het document dat werd opgesteld door de ex-werknemers van Cambridge Analytica bevat weinig informatie over hoe de campagne nu precies gebruik maakte van Facebookgegevens. Een pagina schijnt echter te suggereren dat Cambridge Analytica constant de efficiëntie van haar berichten en advertenties controleerde, en daarbij ook continu feedback gaf over levels of engagement op verschillende platformen zoals Twitter, Facebook en Snapchat. Die feedback was een mooi staaltje  kunstmatige intelligentie en zorgde ervoor dat de zelflerende algoritmen blijvend geüpdatet en verbeterd werden zodat de duizenden politieke boodschappen beter afgestemd waren op de verschillende stemgerechtigden.

 

Data-driven politics

 

Volgens Alexander Nix was Trump’s campagne enkel en alleen gefundeerd op big data. “Quasi elke boodschap die Trump uitstuurde was data-driven.”, aldus Nix. De politieke campagne van Trump kon door handig gebruik van de Cambridge Analytica-modellen bijvoorbeeld zien welke specifieke advertenties het goed deden in kleine geografische gebieden, alsook bij welk soort persoonlijkheden dit het geval was. Hoewel zijn campagnepolitiek doorgaans enorm bekritiseerd wordt, heeft Trump dus erg efficiënt gebruik gemaakt van die analytics door onder het toeziend oog van ‘s werelds meest beruchte digitale marketingbedrijf te improviseren met sleutelwoorden en emotionele thema’s die voor een specifiek persoonlijkheidstype belangrijk zijn.

 

De gedragsmodellen die uit het onderzoek van Kogan en Cambridge Analytica werden geëxtraheerd zorgden ervoor dat de campagne van Trump in staat was om net die parameters te identificeren om individuen met de ‘juiste’ psychometrische kenmerken te targeten. In het geval van Trump waren dat individuen die o.a. laag scoorden op emotionele stabiliteit. Trump’s campagne was in die zin een primeur doordat er voor het eerst in de geschiedenis van de Amerikaanse politiek gebruik werd gemaakt van psychometrische, in plaats van demografische gegevens. De Amerikaanse president maakte tevens van Facebook-marketing zijn belangrijkste speerpunt, dit terwijl Clinton het moest hebben van advertenties op televisie. Die hadden op zich misschien wel een groter, maar eveneens een minder gericht bereik.

 

Imagoschade

 

De imagoschade die Cambridge Analytica heeft geleden door het verkiezingsschandaal is het databedrijf nooit te boven gekomen. Daarom kondigde het op 2 mei aan dat het de deuren zou sluiten. De beslissing kwam er twee maanden nadat het eerder al zijn CEO en Trump campaigner Nix had ontslagen – er moesten nu eenmaal koppen rollen. De opdoeking van Cambridge Analytica lijkt echter een schijnvertoning. In Augustus 2017 werd er al een nieuw bedrijf opgericht in de schoot van Cambridge Analytica: het gros van de werknemers werd getransfereerd naar het nieuwe bedrijf Emerdata, en de hoofdzetel bleef ook voortbestaan op hetzelfde adres als het beruchte Cambridge Analytica.

Hoewel de gelekte data op vraag van Facebook in 2015 werden verwijderd, rezen er na de Amerikaanse presidentsverkiezingen vragen daarover. Huidig directeur van Emerdata, Alexander Tayler, bevestigt met nadruk dat voormalig bedrijf Cambridge Analytica in 2015 alle rauwe data van hun server verwijderde. Op de geëxtraheerde data werden echter verschillende andere datasets toegepast, waardoor de toen ontwikkelde gedragsmodellen blijven voortbestaan. Die modellen kunnen nog steeds gebruikt worden om specifieke groepen te bereiken en om zo hun psychologische kenmerken te misbruiken. Dus hoewel de gelekte data een grote verzameling individuele privacy breaches waren, zijn de modellen een collectieve privacy breach en dus veel schadelijker. Ook al hebben gedragsmodellen hun beperkingen, ze zijn zeer bruikbaar voor het inschatten van iemands politieke neigingen.

 

Inner demons

 

Christopher Wylie, voormalig werknemer bij Cambridge Analytica en klokkenluider van dienst meent dat de campagne van Trump psychometrische gegevens wilde misbruiken om de inner demons van microsegmenten binnen kiezers bloot te leggen. “Als je een pyschologisch profiel kan opstellen van een persoon die meer geneigd is om bepaalde ideeën te vormen – zoals samenzweringstheorieën bijvoorbeeld – en je kan dat profiel omzetten naar datatermen, dan kan je voorspellen hoe waarschijnlijk het is dat die persoon boodschappen met complottheorieën zal aannemen. Daarna kan je hen targeten met advertenties, blogs, websites of fake  news zodat ze die ideeën overal rondom hen beginnen zien.” Op de controversiële vraag of Cambridge Analytica inderdaad fake news heeft verspreid, antwoordt Wylie volmondig ja. Cambridge Analytica zelf ontkent die feiten.

 

De geest is uit de fles

 

Het is duidelijk dat we onze democratische normen en instellingen moeten verdedigen door weerstand op te bouwen tegen die iteratieve tools zoals feedback-loops ongeacht wie ervan gebruik maakt. Aangezien de datamodellen van Cambridge Analytica blijven voortleven, is het principe van psychometrische targeting nu eenmaal toegankelijk voor iedereen. De geest is uit de fles en enkel onze persoonlijke data beschermen is niet genoeg. We moeten ons ook beschermen tegen collectieve inbreuken, want daarin schuilt het echte gevaar.

 

Gerelateerde artikelen

Volg ons

Ga jij apps uit alternatieve appstores installeren?

  • Nee, App Store of Play Store is goed genoeg (57%, 109 Votes)
  • Alleen als ik een app écht nodig heb (29%, 56 Votes)
  • Ja, ik wil apps van andere bronnen installeren (14%, 27 Votes)

Aantal stemmen: 194

Laden ... Laden ...
69% korting + 3 maanden gratis

69% korting + 3 maanden gratis

Bezoek NordVPN

Business