Data Science

Sinds 2016 heeft CentERdata een groep medewerkers die zich bezighoudt met de technieken en toepassingen op het gebied van data science, machine learning en big-data analyses. Expertise vanuit econometrie, data engineering, software ontwikkeling, cognitiewetenschappen, statistiek en kunstmatige intelligentie komen in deze groep samen.

Het team richt zich op het ontwikkelen en toepassen van nieuwe(re) technieken en methodes op het gebied van data science om grote hoeveelheden en complexe data te kunnen analyseren en visualiseren. Zo implementeren en werken we onder andere met

  • big-data infrastructuren
  • krachtige rekenclusters
  • visualisatie van complexe data
  • data mining en tekst mining
  • signaalanalyse, sensordata, internet of things
  • analyse van natuurlijke taal
  • cluster- en classificatietechnieken
  • machine learning en deep learning

We werken voornamelijk met open-source systemen, scripttalen, visualisatiepakketten, plug-ins en online analysetools. Doelstellingen zijn onder andere diepe patroonherkenning, voorspellingen met specifieke algoritmes, besluitvormingsmodellering, complexe data visualisaties, en het faciliteren van onderzoek op het raakvlak met data science.

CentERdata werkt op het gebied van data science nauw samen met het Data Science Centrum Tilburg (DSC/t) en de Jheronimus Academy of Data Science (JADS) in Den Bosch. Sinds de oprichting van beide instituten zijn we betrokken bij het inrichten en uitzetten van strategie en de inzet van technologie voor het onderwijs en onderzoek binnen het vakgebied.

Data science gaat verder dan het visualiseren en analyseren van complexe data. Sommige projecten starten niet met Megabytes of Gigabytes, maar met Terabytes aan data. In de nabije toekomst bestaat de mogelijkheid dat een project van start gaat met een Petabyte data. Bepaalde data behoeft big-data opslag en infrastructuur om er ├╝berhaupt mee te kunnen gaan werken en rekenen. Systemen als Hadoop en Spark en het werken met high-performance rekenclusters en supercomputers (bijvoorbeeld Lisa en Cartesius bij SURFsara of andere cloud diensten) behoren tot onze groeiende expertise.