Afstudeeronderzoek Chantal Blom – deel 3 onderzoeksverslag

Chantal Blom vertelt in dit laatste deel van een 3-luik over haar Data Science afstudeerproject bij Business Data Challengers.Business Intelligence Afstudeer onderzoek

Zo’n 3 maanden geleden vertelde ik over het data science afstudeerproject waar ik samen met Business Data Challengers en het Nederlandse Handbal Verbond (NHV) aan werkte.

In dit verslag zal ik kort de drie fases van het project omschrijven.

1. Data voorbereiding

In deze fase hebben we uit de data zes fysieke tests gekozen op basis waarvan we talenten willen vergelijken. Het werd snel duidelijk dat een bepaalde test (de T-test) nog maar gedaan was door een deel van de talenten.

Deze missende waardes hebben we opgevuld. We hebben eerst de data met de overige fysieke tests geclusterd. Vervolgens hebben we gebruikgemaakt van lineaire regressie om met behulp van de overige fysieke tests en de cluster variabele de T-test waarde van de talenten te schatten.

De output van deze fase was een datatabel met 141 talenten en 6 fysieke testvariabelen.

2. Data analyse

De tweede fase had als input de datatabel uit de eerste fase. Het doel van deze tweede fase was om het beste model waarmee talenten kunnen worden vergeleken te vinden. Het beste model hebben we bepaald op de manier zoals ik omschreven heb in het vorige bericht met k-Nearest Neighbors regressie.

Het verschil is alleen dat we in plaats van naar een bepaald aantal (k) vergelijkbare talenten kunnen kijken ook kunnen kijken naar de talenten binnen een afstand van een bepaald talent. Voor het NHV hebben we op deze manier de beste afstand voor het vergelijken bepaald.

3. Data visualisatie

Spider diagram Chantal Blom Data visualisatie talenten

Met de beste afstand kunnen we bijvoorbeeld een talent vergelijken met andere talenten in dezelfde groep. Een manier om verschillende talenten te visualiseren is de spider chart. Een voorbeeld is te zien in de afbeelding. De verschillende assen representeren verschillende fysieke testen. Het roze talent is het talent dat we wilden vergelijken met de rest van de groep.

Binnen de beste afstand bleken drie talenten te vallen. Een coach kan nu zien waarin het talent nog verschilt van andere talenten in de groep. In de afbeelding is te zien dat het talent met name nog verschilt op de verticale sprong en op de T-test. De coach kan besluiten aan die aspecten meer aandacht te besteden tijdens de trainingen.

Conclusie

Tijdens dit project heb ik veel geleerd en daarom wil ik BDC bedanken voor deze mooie kans. Ondertussen heb ik het project gepresenteerd op de universiteit in Utrecht en het is nu even tijd voor vakantie!

In september gaan we langs bij het NHV op Papendal om de bevindingen te presenteren.

Chantal Blom

Business Data Challengers - Logo

Volg ons op social media en blijf altijd op de hoogte

Bezoekadres:

Hollandse Kade 21
1391 JD Abcoude