Jij, ik en wij allemaal veranderen in een datawolk – en dat is niet goed.

In samenwerking met het tijdschrift FCW Cultura Científica van de Conrado Wessel Foundation presenteert The Conversation Brasil een reeks artikelen over de impact van sociale media op de samenleving. In de onderstaande tekst legt professor Marcelo Soares , specialist in digitale en datajournalistiek, uit hoe sociale media gebruikersgegevens op meerdere niveaus verzamelen en verwerken, met een gebrek aan transparantie en verhullende criteria en algoritmen, wat toezicht belemmert en de verspreiding van desinformatie bevordert. De logica van engagement geeft prioriteit aan emotionele en controversiële content, waardoor gepersonaliseerde bubbels ontstaan die gebruikers isoleren en tot extremisme kunnen leiden.

Acht van de tien internetgebruikers in Brazilië gebruiken regelmatig sociale media, volgens gegevens uit 2024 van het Braziliaanse Informatie- en Coördinatiecentrum (NIC.Br). Terwijl u surft, verzamelen sociale media in stilte veel meer informatie dan we ons bewust verstrekken.

Deze gegevens worden in verschillende lagen verzameld. De nulde laag komt overeen met de basisinformatie die we invullen: naam, leeftijd, interesses en ons netwerk van contacten. Vanuit deze basis monitoren de andere lagen een universum aan gedragsgegevens. Netwerken observeren wat we leuk vinden, delen, waar we op reageren, wat we bekijken en hoeveel tijd we besteden aan een bericht of video. Deze patronen worden statistisch vergeleken met die van andere gebruikers en leiden daaruit af op wie onze smaak, verlangens en zelfs aspecten van onze persoonlijkheid lijken.

De Deense mediaconsultant Thomas Baekdal noemt dit first-order data. Deze data wordt gecreëerd door platforms die alles wat ze uit onze activiteit halen verfijnen, waardoor ze conclusies kunnen trekken over wat onze portemonnees opent. Deze data wordt georganiseerd in profielen die automatisch aan adverteerders worden verkocht, in veilingen die in microseconden plaatsvinden.

Ze hoeven het niet 100% goed te hebben; als ze het fout hebben, is het ergste wat kan gebeuren dat we een advertentie negeren. De tweede laag is daarom de commerciële relatie van de platforms met adverteerders, gebaseerd op onze data. Op basis van alles wat ze over ons weten en wat ze daaruit afleiden, stellen de platforms zeer gedetailleerde profielen op. Ze hoeven niet per se te weten wie je bent, maar ze weten wel dat als ze je smaak en timing goed inschatten, je misschien een video bekijkt, op een advertentie klikt of iets koopt. Het is een beetje demografie, een beetje psychografie en een beetje sluwheid.

Cookies geplaatst door derden

Er is ook een derde laag: cookies van derden, die nog invasiever zijn dan platformcookies. Zo volgen advertenties je van de ene site naar de andere. Cookies zijn kleine bestandjes die websites in je browser plaatsen wanneer je een pagina bezoekt. Ze dienen om je te identificeren bij je volgende bezoek en vormen een soort logboek van alles wat je op de site hebt gedaan.

Ze kunnen afkomstig zijn van de website zelf: wanneer u terugkeert naar een nieuwssite, worden de links waarop u al hebt geklikt paars weergegeven in plaats van blauw. Maar in de lucratieve handel in cookies van derden kunnen cookies die door de website die u bezoekt op uw computer worden geplaatst, afkomstig zijn van advertentienetwerken die ook op andere sites aanwezig zijn. Deze netwerken hebben geen directe relatie met u, maar met de sites die u bezoekt. Als hetzelfde cookiebedrijf bijvoorbeeld een nieuwssite en een kooksite in de gaten houdt, ziet het wie beide bezoekt en wie niet. Daarom gebruiken zoveel sites pop-ups die uw toestemming vragen om cookies te gebruiken: als ze geen cookies van derden gebruiken, hoeft u geen toestemming te vragen.

Deze bedrijven verzamelen gegevens van uw surfgedrag om een verkoopbaar profiel van u te verfijnen. Op een hoger niveau worden deze gegevens verkocht en vergeleken met externe databases, zoals gelekte Serasa-gegevens, bedrijfsgeschiedenis en zelfs medische gegevens. Zo ontstaan databrokers. Ze hebben geen enkele connectie met uw internetgebruik of de websites die u bezoekt. Het zijn bedrijven die al deze gegevens verzamelen om complete profielen te verkopen, vaak inclusief naam, CPF, telefoonnummer of namen van familieleden. Deze markt stimuleert alles, van legitieme reclame tot oplichting en fraude, of het nu via advertenties is ( 84% van de klachten over advertenties gaat over digitale advertenties ) of via meer directe kanalen. Mensen die bijvoorbeeld oplichting plegen via WhatsApp, kochten vaak het profiel van het slachtoffer, compleet met foto, van een website die deze profielen aanbiedt .

Degenen die deze databases gebruiken, hebben geen idee dat ze als product op de markt worden gebracht. Sommigen die dit wel beseffen, vervallen in de misvatting dat "al onze gegevens al openbaar zijn". Het is een misvatting: in deze ernstigere gevallen zijn de gegevens gestolen of onder valse voorwendselen verkregen.

Eiland van gepersonaliseerde prikkels

Het meest directe effect is dat de content die je op sociale media ziet niet neutraal is. Platforms willen je zo lang mogelijk op hen houden, omdat ze je zo meer advertenties kunnen tonen. Je ziet meer berichten van de vrienden met wie je het meest contact hebt, niet van degenen die je het meest mist. Over het algemeen heb je meer contact met degenen die het platform vaker gebruiken en meer onzin of interessantere berichten plaatsen. Als het in plaats van een vriend een onderwerp is, toont het platform je de onderwerpen die je het meest interesseren: likes en shares.

Als je YouTube opent in een nieuw geïnstalleerde browser, zonder in te loggen, zie je een parallel universum van wat het meest aantrekkelijk is in Brazilië. Zodra het platform je leert kennen, personaliseert het alles wat het kan om je daar te houden. Hoe meer tijd er verstrijkt, hoe meer gegevens het verzamelt, hoe verleidelijker het wordt en hoe langer je er blijft. Deze vicieuze cirkel is te vergelijken met die van gokautomaten.

De oneindige feed is zo'n tactiek. De meest agressieve platforms "straffen" links ook af. Facebook vermindert bijvoorbeeld het bereik van berichten met links, omdat ze de gebruiker van het platform afdrijven. Instagram staat zelfs geen klikbare links toe in reguliere berichten. Twitter, inmiddels X, is ook begonnen met het prioriteren van native content. Het doel is om de gebruiker binnen de bubbel te houden, zodat het gegevens kan blijven verzamelen en advertenties kan verkopen. Volgens auteur Shoshanna Zuboff transformeren platforms het gebruikersgedrag om het voorspelbaarder te maken en beter te definiëren wat ze aanbieden. Het probleem is dat dit zeer gesloten bubbels creëert. Het is een systeem dat van ieder van ons een eiland van gepersonaliseerde stimuli maakt.

Algoritmen die naar extreme benaderingen streven

Platforms gebruiken het idee van 'transparantie' zeer flexibel. Er is transparantie voor de consument – de mogelijkheid om te zien in welke advertentiecategorieën je bent beland – maar die is moeilijk toegankelijk, verborgen in de instellingen en vaag geformuleerd. Publieke transparantie over hoe platforms werken wordt systematisch ontmanteld: de API van Twitter, waarmee gebruikers konden zoeken wie met wie over bepaalde onderwerpen sprak, werd in 2022 stopgezet met de overname door Elon Musk. De stopzetting, die een exorbitant bedrag vereiste, was de nagel aan de doodskist van deze onderzoeken. Dit betekent dat we de mogelijkheid hebben verloren om desinformatie en extremisme in realtime te monitoren en eisen tot verantwoording te formuleren.

Sociale media hebben het afgelopen decennium de toegang tot betrouwbare informatie bemoeilijkt. Mensen zijn de gewoonte kwijtgeraakt om rechtstreeks naar nieuwsmakers te gaan en te verwachten dat platforms de essentiële informatie leveren. Dit heeft niet alleen de journalistiek geschaad, maar ook de mythe versterkt dat "als het belangrijk is, het mij wel bereikt" – een idee dat ontstond rond 2012, toen we allemaal dol waren op sociale media. Maar wat het meest circuleert op sociale media zijn niet de essentiële informatie, maar juist de meest klikbare en emotioneel geladen informatie.

Jonah Berger, marketingprofessor aan de Universiteit van Pennsylvania (VS) en auteur van het boek "Contagious: Why Things Catch On", toont dit duidelijk aan in zijn onderzoek. Emotioneel geladen nieuws wordt vaker gelezen en gedeeld en heeft een grotere kans om viraal te gaan, vooral als het woede opwekt. Deze voortdurende mobilisatie heeft politieke, sociale en zelfs interpersoonlijke gevolgen. En natuurlijk geeft het algoritme prioriteit aan dit soort content, juist omdat het interactie stimuleert. Het algoritme wil niet dat je geïnformeerd wordt; het wil dat je reageert door te liken, te delen en te reageren – zolang het allemaal binnen de ommuurde tuin van de platforms blijft. Politiek gezien leidt dit tot asymmetrische demobilisatie en mobilisatie.

Zeynep Tufekci , hoogleraar sociologie en public relations aan Princeton University (VS), liet op YouTube zien dat dit model een pad naar extremisme kan inhouden. Je begint met zoeken naar video's over gezonde voeding, en als je de aanbevelingen van het platform volgt, wordt de toon geleidelijk opgevoerd totdat je complottheorieën over vaccins ziet. Het algoritme stuurt je naar de meest extreme content over dat onderwerp, omdat dat je aandacht het meest trekt. Hoe meer je de suggesties van het algoritme opvolgt, hoe voorspelbaarder je gedrag wordt en hoe gemakkelijker het wordt om je met advertenties te targeten. Zelfs als je eigen familie het niet meer kan verdragen.

Taalkundige vullingsmachines

AI is al lang aanwezig in deze processen, met name in de vorm van machine learning. Het analyseert wat er in totaal is bekeken, aangeklikt en genegeerd, vergelijkt dit en gebruikt het om te voorspellen wat mensen met een vergelijkbare smaak mogelijk als volgende willen kijken. Dit geldt voor sociale media, Netflix en elk platform dat content aanbeveelt. In het ergste geval kies je iets anders om te kijken op hetzelfde platform, wat een ander belangrijk signaal voor hen is, of je zet de tv uit en gaat slapen.

Met generatieve AI wordt het scenario nog complexer. Mensen gebruiken deze modellen al om op grote schaal content te produceren – video's, boeken, podcasts – die soms onjuiste informatie bevatten. In 2023 werden tien "biografieën" van Claudia Goldin, winnares van de Nobelprijs voor Economie , de dag na de aankondiging gepubliceerd, waarvan sommige door AI zijn gegenereerd. Deze modellen simuleren zeer overtuigende taal, die op basis van waarschijnlijkheid op het scherm wordt gegoten. Ik grap wel eens dat het "linguïstische opvulmachines" zijn, die gokken met het zelfvertrouwen van een blanke man van middelbare leeftijd in een bar. Iedereen die generatieve AI gebruikt zonder de resultaten goed te controleren, heeft een grote kans om misinformatie over de hele wereld te verspreiden. Iedereen die de resultaten van linguïstische opvulmachines echter goed controleert en corrigeert, loopt het risico alle tijd te verliezen die hij of zij heeft gewonnen met het gebruik van de digitale assistent. Of zelfs meer.

Een van de grootste, meest dringende behoeften van vandaag is het waarborgen van transparantie op platforms: ze dwingen om de werking van hun algoritmes open te stellen voor audits – zodat we weten wie wat ziet, waarom ze het zien en wie ervoor betaald heeft om te worden uitgelicht – en postgegevens vrijgeven. Dit is wat Bluesky of wijlen Twitter deden, iets wat Facebook en Instagram nooit deden. Evenzo is het essentieel om influencers te reguleren, wier macht om producten, ideeën en zelfs weddenschappen te verkopen, zoals blijkt uit de CPI das Bets (Parlementair Strafonderzoek naar Weddenschappen), zonder duidelijke regelgeving opereerden en het tijdens de pandemie opgebouwde vertrouwen commercieel uitbuitten op een vaak misbruikende manier, wat om grenzen vraagt. Alleen door deze logica van hoe netwerken werken te begrijpen en daarop gebaseerde wetgeving te ontwikkelen, en niet alleen in traditionele communicatie, kan deze escalatie van vulgariteit worden bedwongen.

Tegelijkertijd hebben sommige sociale netwerken een andere dynamiek. Bluesky maakt bijvoorbeeld geen gebruik van virale algoritmen: wie 's ochtends post, bereikt alleen degenen die op dat moment online zijn, en reposts zijn nodig om het bereik te vergroten. Het bestraft links niet en geeft geen prioriteit aan controversiële content, waardoor de omgeving minder giftig is. Met automoderatietools kun je aanstootgevende reacties verwijderen, communitylijsten volgen en profielen massaal blokkeren. Mastodon heeft een nog opener protocol dan Bluesky en biedt veel flexibelere manieren van modereren, maar velen vonden het te technisch, waardoor het in Brazilië buiten de meer technische communities niet aansloeg.

Er is hoop, maar die hangt van ons af: we moeten beter begrijpen hoe deze platforms werken, transparantie eisen, regelgevende initiatieven ondersteunen en zoeken naar een gezondere omgeving voor het publieke debat. Er zijn veel goede mensen die onderzoek doen en nieuwe wegen voorstellen, zoals onderzoekers Letícia Cesarino ( UFSC ), Rosana Pinheiro Machado, Francisco Brito Cruz (oprichter van InternetLab en nu onafhankelijk), Rafael Evangelista ( Labjor/Unicamp ) en vele andere kritische en technische stemmen.

Sociale media bepalen wat we zien, wat we denken en zelfs hoe we ons gedragen; we kunnen al deze macht niet overlaten aan bedrijven die omkoopbaar zijn of de beschermingsmechanismen van gebruikers ondermijnen. We moeten collectief nadenken over hoe we onszelf willen informeren, communiceren en ons wereldbeeld willen opbouwen, en proberen onszelf geleidelijk los te maken van de afhankelijkheid van elke 'big tech' en alternatieven te zoeken. Deze alternatieven bestaan, maar ze verkopen zichzelf slecht.

Nog belangrijker zou zijn om vaker de stekker eruit te trekken van sociale media, om elkaar face-to-face te spreken zonder de noodzaak om viraal te gaan of lastiggevallen te worden met advertenties. Het offline leven geeft betekenis aan alles wat er op het scherm gebeurt.