Data science en big data

Image

Data kom je overal tegen. Sommige bedrijven verzamelen doelgericht data om hun klanten beter te leren kennen en zo betere service te bieden. Andere organisaties en overheden beheren data die nodig (of verplicht) zijn voor het realiseren van dienstverlening. Door het combineren van technologie en data kunnen dingen gemakkelijker gemaakt worden.

Wat is data science?

Data science is nog een relatief jong vakgebied. Het draait om het analyseren en interpreteren van grote hoeveelheden data die, vaak complex en ongestructureerd, en tegenwoordig dagelijks gegenereerd worden. De kunst van data science is het transformeren van data in waardevolle acties.

Met data science focussen we ons op het herkennen van patronen om op basis hiervan voorspellingen te doen voor de toekomst. Dit in tegenstelling tot wat er meestal gebeurt bij traditioneel statistisch onderzoek. Daarbij wordt vaak gezocht naar verbanden of processen die in het verleden hebben plaatsgevonden. Data science richt zich dus meer op het kunnen doen van aanbevelingen voor belangrijke beslissingen die genomen moeten worden.

Image

Centerdata en data science

Sinds 2017 biedt Centerdata data science-activiteiten aan als aanvulling op bestaande diensten en producten. Ons data science team houdt zich bezig met technieken en toepassingen voor grote hoeveelheden (complexe) data vanuit diverse bronnen, zogenaamde big data. We gebruiken machine en deep learning, data en tekst mining en visualisatie technieken. Expertise vanuit econometrie, data engineering, software ontwikkeling, cognitiewetenschappen en kunstmatige intelligentie komen hierbij samen. Ons team kan zo nieuwe inzichten verschaffen en data uit diversen bronnen in (maatschappelijke) waarde omzetten. Denk bijvoorbeeld aan sensordata, social media data, internet data en data uit ons eigen, representatieve LISS panel. We werken onder andere met:

  • big-data infrastructuren
  • krachtige rekenclusters
  • visualisatie van complexe data
  • data mining en tekst mining
  • signaalanalyse, sensordata, internet of things
  • analyse van natuurlijke taal
  • cluster- en classificatietechnieken
  • machine learning en deep learning

We maken voornamelijk gebruik van open-source systemen, scripttalen, visualisatiepakketten, plug-ins en online analyse tools. Doelstellingen zijn onder andere diepe patroonherkenning, voorspellingen met specifieke algoritmes, besluitvormingsmodellering, complexe data visualisaties, en het faciliteren van onderzoek op het raakvlak met data science.

Image

Zelf aan de slag met data science?

Hoe kunnen we het potentieel van data science bij ons vraagstuk of binnen onze organisatie beter benutten? Opdrachtgevers stellen ons regelmatig deze vraag. Datagedreven organisaties ontvangen continu terugkoppeling over de effectiviteit van hun acties. Wat werkt wel en wat werkt niet? Door data voor u te laten werken, kunt u beleid sneller evalueren en aanpassen. Doen en denken gaan veel meer samen. Vaak komen organisaties tot verrassende inzichten en boeiende discussies als ze gevoed worden door feiten vanuit de data.

Op het terrein van data science is een breed palet aan expertise, kennis en ervaring aanwezig bij Centerdata: van kunstmatige intelligentie tot praktische besluitvormingsmodellen. Het ene moment houden onze data scientists zich bezig met technieken en toepassingen voor big data of het gebruik van machine learning. Het andere moment gaan we op zoek naar waardevolle inzichten in bedrijfsdocumenten zoals logboeken van callcenters, berichten op sociale netwerken, medische dossiers, jaarverslagen of wetteksten. Of werken we met partners aan meerjarige data science projecten waarbij we grote maatschappelijke opgaven aanpakken, zoals armoede, huiselijk geweld of criminaliteit. Er is veel mogelijk op het gebied van data science.

Greep uit onze projecten

  • Ondermijning op bedrijventerreinen tegengaan

De provincies Gelderland en Noord-Brabant willen ondermijning op bedrijventerreinen eerder en beter signaleren. Welke signalen kunnen wijzen op ernstige criminaliteit? En hoe kan data science bijdragen aan de ontwikkeling van effectief beleid? Samen met Avans Hogeschool zijn wij met behulp van data science technieken gedurende een jaar op zoek naar verbanden in de beschikbare data over lokale bedrijventerreinen.

  • Smart Start

In het programma Smart Start werken we aan modelaanpak voor preventief beleid, om de kansen op veilig opgroeien van kinderen te vergroten en problemen bij kinderen vóór te zijn. Daarbij combineren we kennis en data. Zo kijken we bijvoorbeeld naar ervaringen van betrokkenen en maken we gebruik van de kennis van zorgprofessionals. Dit brengen we samen met data science-technieken om vervolgens nieuwe inzichten te creëren voor het voorspellen van potentiële problemen en mogelijke oplossingen.

  • Overstapberoepen in kaart brengen

Onlangs deden we een haalbaarheidsonderzoek waarbij we keken of mensen met krimpberoepen kennis en vaardigheden in huis hebben waarmee ze kunnen overstappen naar technische beroepen in de energiesector, waar juist een tekort is aan personeel. Zie de video hieronder.

  • Smart Street Scan

Voor een gemeente hebben we een haalbaarheidsonderzoek uitgevoerd voor de implementatie van AI-technieken bij het opruimen van straatafval. In de pilot Smart Street Scan hebben we de openbare ruimte automatisch gescand aan de hand van sensor- en cameratechnologie. Het idee is dat de dienstverlening van de vuilophaaldienst vervolgens vergaand kan worden gestroomlijnd, bijvoorbeeld door veegroutes te optimaliseren.

Met data science overstapberoepen in kaart brengen

Patricia Prüfer geeft kort uitleg over één van onze data science projecten.

Meer weten? Neem contact op.

Ontmoet het gehele team
dr. Patricia Prüfer
dr. Patricia Prüfer
Hoofd afdeling Beleidsonderzoek & Analyse
drs. Marcia den Uijl
drs. Marcia den Uijl
Plv. hoofd afdeling Beleidsonderzoek & Analyse / Senior data scientist

Een greep uit onze opdrachtgevers

Logo
Logo