Evaluatie en resultaten
Bij de evaluatie van een voorspellend model is het belangrijk om diverse prestatiemetrics te gebruiken om een volledig beeld te krijgen van de nauwkeurigheid en betrouwbaarheid. Accuracy is een veelgebruikte metriek die het percentage correcte voorspellingen meet, zowel voor stijgingen als dalingen. In dit model is de accuracy 58,21%, wat betekent dat het in iets meer dan de helft van de gevallen correct voorspelt of de markt omhoog of omlaag zal gaan. Hoewel dit resultaat boven kansniveau (50%) ligt, is er nog ruimte voor verbetering.
Om dieper in te gaan op de prestaties van het model, zijn precision, recall en de F1-score waardevolle metrics die meer inzicht geven. Precision meet hoeveel van de voorspelde stijgingen daadwerkelijk correct waren. Voor stijgingen (klasse 1) is de precision 57%, terwijl voor dalingen (klasse 0) de precision 62% is. Dit betekent dat het model iets nauwkeuriger is bij het voorspellen van dalingen.
Recall daarentegen kijkt naar hoeveel van de werkelijke stijgingen correct zijn voorspeld. Hier scoort het model sterk bij stijgingen met een recall van 81% (klasse). Wat betekent dat het merendeel van de werkelijke stijgingen goed wordt herkend. Voor dalingen (klasse 0) is de recall echter aanzienlijk lager, namelijk 34%, wat aangeeft dat het model moeite heeft om dalingen goed te voorspellen. De F1-score, die precision en recall combineert in een harmonisch gemiddelde, maakt dit verschil duidelijk. Voor stijgingen is de F1-score 0.67, wat aantoont dat het model op dit vlak relatief goed presteert. Voor dalingen blijft de F1-score echter steken op 0.44, wat het zwakkere vermogen van het model om dalingen correct te identificeren onderstreept.
De confusion matrix, zie figuur 1 . visualiseert deze bevindingen op een heldere manier. De diagonale waarden (33,83% en 80,83%) vertegenwoordigen de correct voorspelde gevallen, terwijl de off-diagonale waarden (66,17% en 19,17%) de foutieve voorspellingen tonen. Dit onderbouwt dat het model vooral goed presteert bij stijgingen, maar aanzienlijke moeite heeft met het betrouwbaar herkennen van dalingen.