Hoe data science helpt om criminaliteit op bedrijventerreinen te voorspellen

Welke indicatoren kunnen (georganiseerde) criminaliteit en ondermijning op bedrijventerreinen voorspellen? Onderzoek door het data science-team van CentERdata in de gemeente Tilburg leverde een ranglijst met vijftien risico-indicatoren op, als handvat voor lokale bestuurders.

Witwaspraktijken, hennepteelt, doorvoer van illegale goederen: op veel bedrijventerreinen is er sprake van verborgen criminaliteit. Zeker verloederde bedrijventerreinen bieden vaak een vruchtbare voedingsbodem voor criminele activiteiten. Er is daarbij sprake van een continuüm, met aan de ene kant de normale bovenwereld en aan de andere kant de harde criminele onderwereld. Daartussen bestaan allerlei vormen; variërend van bewust wegkijken, via een graantje meepikken, tot aan het verlenen van hand- en spandiensten aan criminelen.

Glijdende schaal

In opdracht van het Wetenschappelijk Onderzoek- en Documentatiecentrum (WODC) van het ministerie van Justitie en Veiligheid, onderzocht CentERdata welke indicatoren er zijn voor (georganiseerde) criminaliteit en ondermijning op bedrijventerreinen. Doel van het onderzoek was om bestuurders concrete handvaten te bieden, aan de hand waarvan ze kunnen bepalen in welk stadium een bedrijventerrein verkeert. Waar bevindt een specifiek bedrijventerrein zich op de ‘glijdende schaal’ van (georganiseerde) criminaliteit en ondermijning?

Uiteenlopende data

Na een vooronderzoek (bestaande uit een literatuurstudie, een expertmeeting en interviews) verzamelde het onderzoeksteam uiteenlopende data, waaronder gegevens uit het Integraal Bedrijventerreinen Informatie Systeem (IBIS), het aantal meldingen bij de politie en Meld Misdaad Anoniem, het aantal meldingen bij het Centraal Meldpunt van de gemeente Tilburg (bijvoorbeeld over drugsoverlast), en informatie van netbeheerder Enexis. Ook gegevens uit de Basisregistratie Adressen en Gebouwen (BAG) en het bedrijvenregister van de KvK werden bij het onderzoek betrokken.

Belangrijkste indicatoren

Resultaat was een uitgebreide dataset met mogelijke indicatoren van (georganiseerde) criminaliteit en ondermijning op bedrijventerreinen. De data werden geanalyseerd aan de hand van de data science-methode Random Forest.

In de ranglijst van de vijftien belangrijkste indicatoren met daadwerkelijk voorspellende waarde, staan met name de usual suspects die ook in het vooronderzoek als belangrijk naar voren kwamen.

  • Zo lijkt een combinatie van factoren die betrekking hebben op de fysieke omgeving belangrijk te zijn. Daarbij gaat om zaken als veroudering en leegstand, de waarde van het onroerend goed, de mate van toezicht, het aantal meldingen bij de politie, en het verloop op een bedrijventerrein.
  • Ook het soort bedrijven lijkt een rol te spelen, bijvoorbeeld de rechtsvorm en grootte.
  • Tot slot kwam de aanwezigheid van veel extra vestigingen, zoals extra KvK-inschrijvingen, beheer-bv’s en opslagloodsen, naar voren als risico-indicator.


Verkennende pilot

Het ging in dit geval om een verkennende pilot, met een steekproef van dertig bedrijventerreinen in de gemeente Tilburg. Vervolgonderzoek op grotere schaal is nodig om de resultaten te bevestigen. Wél lijkt nu al duidelijk dat data science-methoden kunnen helpen bij het vinden van indicatoren. Ook zou dezelfde methodiek in de toekomst (met enkele aanpassingen qua databronnen) toegepast kunnen worden voor soortgelijk onderzoek in woonwijken.


Meer weten?

CentERdata voerde het onderzoek uit in samenwerking met het Expertisecentrum Veiligheid van Avans Hogeschool en met het Data Science Center van Tilburg University. Meer weten? Op de website van het WODC is zowel het eindrapport als een samenvatting te vinden.