Data Science werpt nieuw licht op relatie tussen beweging en gezondheid

Hoe ziet de relatie tussen fysieke activiteiten en gezondheid eruit? CentERdata onderzocht het door artifical intelligence toe te passen op een combinatie van objectief verkregen hoogfrequente accelerometerdata en gegevens uit vragenlijsten.

Dat voldoende lichaamsbeweging bijdraagt aan een goede gezondheid, staat niet ter discussie. Maar hoe ziet de relatie tussen lichaamsbeweging en gezondheid er nu precies uit? Onderzoek naar deze relatie wordt veelal uitgevoerd op basis van zelfrapportage, waarbij deelnemers zélf aangeven hoeveel ze bewegen. Een methode die vanzelfsprekend subjectief is; mensen geven vaak sociaal wenselijke antwoorden, of herinneren zich simpelweg niet goed genoeg wat ze precies gedaan hebben.

Overschatting

Om te komen tot meer objectieve data, voerde CentERdata een onderzoek uit in het representatieve LISS panel. Daarbij droegen ruim duizend panelleden acht dagen lang een accelerometer die hun fysieke activiteit meet. In combinatie met door de panelleden zélf gerapporteerde gegevens over hun dagelijkse bezigheden en mate van inspanning, kon een vergelijking worden gemaakt tussen objectief gemeten en subjectief gerapporteerde activiteit. Het onderzoek maakte duidelijk dat mensen hun mate van fysieke activiteit doorgaans overschatten.

Vervolgstudie

In vervolganalyses zijn de objectieve data opnieuw geanalyseerd met machine learning-technieken als Random Forest en Support Vector Machines. Hierdoor konden specifieke fysieke activiteiten (zoals wandelen, autorijden, hardlopen, fietsen, zitten en slapen) worden onderscheiden; iets wat eerder niet mogelijk was. Deze activiteiten zijn vervolgens door middel van een clusteringtechniek (K-modes) gecombineerd met longitudinale data uit het LISS panel, zoals gezondheid, persoonlijkheid en relevante achtergrondgegevens.

Objectief beeld

Hierdoor ontstaat een helder, objectief beeld van de relatie tussen specifieke fysieke activiteiten, gezondheid, persoonlijkheid en socio-economische en demografische informatie. Zo is er een sterke relatie gevonden tussen de fysieke activiteiten met een gemiddelde tot hoge inspanning (lopen, fietsen, hardlopen) en de waargenomen gezondheid. Ook depressie, roken, weinig fysieke activiteit (veel zitten) en waargenomen gezondheid laten een sterk verband zien.

Door de verschillende gegevens met elkaar te combineren ontstaat inzicht in welke specifieke fysieke (in)activiteiten een relatie hebben met een betere of slechtere gezondheid. Momenteel worden vervolganalyses uitgevoerd om dit inzicht verder te vergroten.

Potentie

Data-wetenschappers Joris Mulder en Pradeep Kumar presenteerden de eerste onderzoeksresultaten begin maart tijdens conferenties in Mannheim en Keulen. Volgens Joris Mulder toont het onderzoek aan dat de toepassing van artifical intelligence, zoals machine learning en deep learning, kan leiden tot nieuwe inzichten rondom gezondheid en fysieke activiteit. ‘Dit project laat de potentie zien van de combinatie van hoogfrequente data met survey- en registerdata. In vervolgonderzoek richten we ons op de relatie tussen specifieke fysieke activiteiten en verschillende soorten lichamelijke en psychologische klachten en ziektes’.

Figuur 1: bewegingspatroon uit de accelerometer dat als hardlopen is herkend

Figuur 2: bewegingspatroon uit de accelerometer dat als zitten is herkend