Afstudeeronderzoek Chantal Blom - deel 3 onderzoeksverslag

Archief

categorieën

Chantal Blom vertelt in dit laatste deel van een 3-luik over haar Data Science afstudeerproject bij Business Data Challengers.

 

Zo’n 3 maanden geleden vertelde ik over het data science afstudeerproject waar ik samen met Business Data Challengers en het Nederlandse Handbal Verbond (NHV) aan werkte.

In dit verslag zal ik kort de drie fases van het project omschrijven.

1. Data voorbereiding

In deze fase hebben we uit de data zes fysieke tests gekozen op basis waarvan we talenten willen vergelijken. Het werd snel duidelijk dat een bepaalde test (de T-test) nog maar gedaan was door een deel van de talenten.

Deze missende waardes hebben we opgevuld. We hebben eerst de data met de overige fysieke tests geclusterd. Vervolgens hebben we gebruik gemaakt van lineaire regressie om met behulp van de overige fysieke tests en de cluster variabele de T-test waarde van de talenten te schatten.

De output van deze fase was een data tabel met 141 talenten en 6 fysieke test variabelen.

 

2. Data analyse

De tweede fase had als input de data tabel uit de eerste fase. Het doel van deze tweede fase was om het beste model waarmee talenten kunnen worden vergeleken te vinden. Het beste model hebben we bepaald op de manier zoals ik omschreven heb in het vorige bericht, met k-Nearest Neighbors regressie.

Het verschil is alleen dat we in plaats van naar een bepaald aantal (k) vergelijkbare talenten kunnen kijken, ook kunnen kijken naar de talenten binnen een afstand van een bepaalde talent. Voor het NHV hebben we op deze manier de beste afstand voor het vergelijken bepaald.

 

3. Data visualisatie

Spider diagram Chantal Blom Data visualisatie talenten

In dit spider diagram (gemaakt door Chantal Blom) zijn verschillende talenten van handballers weergegeven.

Met de beste afstand kunnen we bijvoorbeeld een talent vergelijken met andere talenten in dezelfde groep. Een manier om

verschillende talenten te visualiseren is de spider chart. Een voorbeeld is te zien in de afbeelding. De verschillende assen representeren verschillende fysieke testen. Het roze talent is het talent dat we wilden vergelijken met de rest van de groep.

Binnen de beste afstand, bleken drie talenten te vallen. Een coach kan nu zien waarin het talent nog verschilt van andere talenten in de groep. In de afbeelding is te zien dat het talent met name nog verschilt op de verticale sprong en op de T-test. De coach kan besluiten aan die aspecten meer aandacht te besteden tijdens de trainingen.

 

 

 

Conclusie

Tijdens dit project heb ik veel geleerd en daarom wil ik BDC bedanken voor deze mooie kans. Ondertussen heb ik het project gepresenteerd op de universiteit in Utrecht en het is nu even tijd voor vakantie!

In september gaan we langs bij het NHV op Papendal om de bevindingen te presenteren.

 

Chantal Blom

 

Share This

Share this post with your friends!

De website van Business Data Challengers
maakt gebruik van cookies
meer informatie

De cookie-instellingen op deze website zijn ingesteld op 'toestaan cookies "om u de beste surfervaring mogelijk. Als u doorgaat met deze website te gebruiken zonder het wijzigen van uw cookie-instellingen of u klikt op "Accepteren" hieronder dan bent u akkoord met deze instellingen.

Sluiten