AFSTUDEERONDERZOEK CHANTAL BLOM - DEEL 2

Het is alweer een tijd geleden dat ik vertelde over het Data Science project waaraan ik samen met BDC en het Nederlandse Handbal Verbond (NHV) werk.

Ondertussen zijn we qua tijd al over de helft van het project en het is al een stuk duidelijker geworden welke kant we wat betreft data-analyse op gaan. In dit bericht zal ik uitleggen wat het idee is en waar we nu staan.

Bij het NHV wordt van handbaltalenten uit verschillende teams data verzameld.
Dit is data van metingen als hoogspringen, werpen vanuit verschillende posities, een sprinttest etc.
De meetresultaten van de talenten zijn nu gestructureerd.

Het idee is nu om de scouts en trainers een mogelijkheid te geven talenten te vergelijken.
Voor trainers kan het bijvoorbeeld nuttig zijn om te zien waar vergelijkbare talenten verschillen
en waar een talent extra op zou kunnen trainen.
Het vergelijken van talenten doen we door de afstand tussen talenten in de feature space te bepalen.
We kijken dan naar de k dichtstbijzijnde talenten.

Er zijn nu twee parameters die ervoor kunnen zorgen dat een vergelijking beter of slechter is; het aantal talenten waarnaar we kijken en de meetresultaten die we meenemen in de vergelijking.
Om de beste combinatie van deze parameters te bepalen, gebruiken we k-Nearest Neighbor regressie.
We gebruiken een deel van de data om de verschillende combinaties uit te proberen.

In het onderstaande filmpje wordt uitgelegd hoe de beste waarde van k kan worden bepaald
met behulp van k-Nearest Neighbor regressie.

Het idee is dat we met het algoritme de waarde voor elke meting van elke talent schatten en
het verschil tussen de geschatte waarden en de daadwerkelijke waarden bepalen.
Dit doen we dan voor verschillende combinaties van k en eigenschappen.

Het model, de beste waarde voor k en de beste combinatie van eigenschappen, kan in een applicatie op verschillende manieren worden gebruikt om talenten te vergelijken.

In een volgend artikel zal ik hier meer over delen.

 

Chantal Blom

Business Data Challengers

Business Data Challengers - Logo

Volg ons op social media en blijf altijd op de hoogte

Bezoekadres:

Hollandse Kade 21
1391 JD Abcoude