De sociale wetenschappen hebben een schat aan onderzoek opgeleverd over de factoren die bepalen of en wanneer mensen kinderen krijgen. Toch wordt zelden onderzocht hoe goed deze factoren en theorieën nieuwe data kunnen voorspellen. Dit bemoeilijkt het vergelijken van studies en beperkt de opbouw van kennis.
In dit artikel presenteren we twee datasets die kunnen worden gebruikt om de voorspelbaarheid van vruchtbaarheidsuitkomsten in Nederland te onderzoeken. De eerste dataset is gebaseerd op het LISS panel, een langlopende enquête met duizenden variabelen over uiteenlopende onderwerpen, zoals persoonlijke voorkeuren en waarden. De tweede dataset is afkomstig uit de Nederlandse registers, die geen informatie bevatten over houdingen en voorkeuren, maar wel gedetailleerde gegevens bieden over de levensloop van miljoenen Nederlanders.
We beschrijven beide datasets, de gebruikte steekproeven en de relevante vruchtbaarheidsuitkomsten. Daarnaast introduceren we de PreFer datachallenge uitdaging, een initiatief dat in het voorjaar van 2024 van start gaat. Deze uitdaging combineert de unieke sterke punten van beide datasets om de voorspelbaarheid van vruchtbaarheidsuitkomsten te meten. Dit kan zowel ons begrip van vruchtbaarheidsgedrag verdiepen als nieuwe inzichten opleveren in de computationele sociale wetenschappen.
Tot slot geven we praktische informatie voor geïnteresseerde deelnemers die aan de PreFer datachallenge willen meedoen.