Onderzoekers die sociale mediagegevens verzamelen via zogenoemde datadonaties, staan vaak voor een lastige afweging: hoe meer data zij opvragen bij deelnemers, hoe minder mensen de procedure daadwerkelijk voltooien. Dat blijkt uit een nieuw onderzoek van wetenschappers van de Universiteit van Amsterdam, Universiteit Utrecht en Centerdata, gepubliceerd in Social Science Computer Review.
Datadonatie studies
Bij een datadonatiestudie worden deelnemers gevraagd hun gebruikersdata op te vragen bij een platform zoals Facebook of Instagram, om deze vervolgens te delen met onderzoekers. Dankzij Europese privacywetgeving (de AVG) hebben gebruikers het recht om een kopie van hun eigen data op te vragen. Onderzoekers maken hier steeds vaker gebruik van, omdat zulke gegevens een nauwkeuriger beeld geven van gedrag dan traditionele vragenlijsten.
Het experiment
Voor dit onderzoek werden bijna duizend deelnemers van het Centerpanel uitgenodigd om hun Facebook- en/of Instagramdata te doneren. De helft van de deelnemers werd gevraagd de standaardinstelling te gebruiken: data van het afgelopen jaar. De andere helft werd gevraagd hun volledige accountgeschiedenis op te vragen, die bij sommige gebruikers meer dan tien jaar beslaat.
Langer wachten lijkt boosdoener
Het opvragen van meer data leidde tot lagere deelnamecijfers. Bij Instagram voltooide 67% van de deelnemers in de controlegroep de donatie succesvol, tegenover slechts 33% in de groep die de volledige geschiedenis moest opvragen. Bij Facebook waren de verschillen kleiner maar gingen ze dezelfde kant op.
De onderzoekers dachten eerst dat zorgen over privacy de oorzaak zouden zijn: wie meer data deelt, voelt zich misschien kwetsbaarder. Dat bleek echter niet het geval. Beide groepen scoorden vrijwel hetzelfde op vragen over angst over privacy. De werkelijke oorzaak bleek praktischer van aard: grotere datapakketten kosten platforms veel meer tijd om te verwerken. Waar een pakket met een tijdvenster van één jaar vaak binnen een dag klaarstond, moesten deelnemers die hun volledige geschiedenis opvroegen soms meerdere dagen wachten. Veel mensen haakten in die tussentijd af.
Ook inhoud data verandert
Naast het effect op deelname heeft de omvang van het tijdvenster ook gevolgen voor de data zelf. Sommige gegevens, zoals gevolgde accounts, groepslidmaatschappen en likes, bleken sterk afhankelijk van het gekozen tijdvenster. Een lijst van gevolgde accounts uit een éénjaarsverzoek weerspiegelt niet de huidige situatie van een gebruiker, maar alleen wat zij dat jaar volgden. Andere gegevens, zoals advertentie-interacties en zoekopdrachten, waren nauwelijks tijdgevoelig: die leverden dezelfde data op, ongeacht of één jaar of de volledige geschiedenis werd opgevraagd.
Wat betekent dit voor onderzoek?
De onderzoekers adviseren het tijdvenster af te stemmen op de onderzoeksvraag. Is een recente momentopname voldoende, vraag dan niet meer data op dan nodig is. Is meer context essentieel, investeer dan in manieren om deelnemers betrokken te houden tijdens het wachten. En kijk altijd kritisch naar wat de gevraagde data daadwerkelijk inhoudt, en of dat ook overeenkomt met hetgeen dat onderzocht moet worden.