Buy-and-Hold versus AI: Hoe scoort een algoritme als
beleggingsstrategie?

Kunstmatige intelligentie verandert de financiële wereld door data te analyseren, patronen te herkennen en nauwkeurige voorspellingen te ondersteunen. Dit model voorspelt of aandelen stijgen of dalen en ontwikkelt een geoptimaliseerde handelsstrategie om rendement te verhogen. In dit artikel bespreken we processen zoals data-acquisitie, featureselectie, LSTM-netwerken en analyseren we de prestaties via backtesting in vergelijking met de Buy-and-Hold-strategie.

Beleggen, pinpas, geld, contant, debit, credit

Het doel van ons model is het voorspellen van prijsstijgingen of -dalingen van een aandeel. Op basis van deze voorspellingen wordt een geoptimaliseerde handelsstrategie ontwikkeld en toegepast. In deze blog bespreken we stap voor stap de belangrijkste technieken en processen die worden gebruikt om dit model te ontwerpen, te bouwen én te implementeren.

current rate, actuele cijfers, voorspellingen

Data en methodologie

De data bestaat uit een combinatie van verschillende benaderingen die samen een breed beeld schetsen van de factoren die aandelenprijzen beïnvloeden. Technische analyse gebruikt historische marktdata, zoals prijzen en volumes, om indicatoren zoals voortschrijdende gemiddelden (MA en EMA), de relatieve sterkte-index (RSI) en Bollinger Bands te berekenen. Deze indicatoren bieden inzicht in trends, momentum en volatiliteit. Fundamentele analyse voegt macro-economische gegevens toe, zoals werkloosheidscijfers, rentevoeten en het BBP via de FRED API, en verwerkt daarnaast seizoensinvloeden en prijsgerelateerde patronen. Sentimentanalyse vult deze dataset aan door marktsentiment te meten via gescrapete nieuwstitels, die worden geanalyseerd op hun positieve of negatieve toon. Deze gecombineerde dataset biedt een compleet en veelzijdig fundament voor nauwkeurige aandelenvoorspellingen.

methodologie, methode, plan van aanpak, werken volgens een methode

Een evenwichtige dataset is essentieel voor vrijwel elk machine learning-model om nauwkeurige en betrouwbare voorspellingen te kunnen doen. Bij een sterk uit balans zijnde dataset, zoals een overwicht aan voorbeelden van stijgingen ten opzichte van dalingen, bestaat het risico dat het model te sterk leunt op de dominante klasse. Dit resulteert in scheve voorspellingen en een verminderde betrouwbaarheid.

Om dit probleem te voorkomen en het model te voorzien van een representatief en gebalanceerd leerproces, wordt SMOTE (Synthetic Minority Oversampling Technique) toegepast. Deze techniek balanceert de dataset door synthetische voorbeelden te genereren van de minder voorkomende klasse, in dit geval dagen waarop de aandelenkoers daalt. Het resultaat is een dataset waarin zowel stijgingen als dalingen evenwichtig vertegenwoordigd zijn, wat het LSTM-model in staat stelt om patronen in beide categorieën beter te herkennen en nauwkeuriger te voorspellen.

Daarnaast worden geavanceerde technieken zoals PCA (Principal Component Analysis) en Lasso-regressie ingezet voor featureselectie. PCA reduceert de dimensies van de dataset door redundante informatie te comprimeren tot een kleiner aantal relevante componenten. Lasso helpt vervolgens om variabelen te identificeren die weinig bijdragen aan de voorspellingen, zodat deze kunnen worden verwijderd. Dit proces maakt het model efficiënter en vermindert de kans op overfitting.

human technologie, slim, technisch

Modelontwikkeling

Nadat de dataset is gebalanceerd en geoptimaliseerd met PCA en Lasso-regressie, wordt het Long Short-Term Memory (LSTM)-model getraind. Dit model is specifiek geschikt voor tijdreeksen, omdat het patronen over meerdere dagen kan herkennen. Dankzij het vermogen om informatie over langere perioden vast te houden, is een LSTM bijzonder geschikt voor complexe datasets waarin eerdere gebeurtenissen de toekomstige uitkomsten beïnvloeden, zoals bij aandelenkoersen. Het model begint met het creëren van sequenties, waarbij 30 opeenvolgende dagen aan gegevens worden gebruikt om de koers van de volgende dag te voorspellen. Het LSTM-model zelf bestaat uit meerdere lagen, met ingebouwde dropout-mechanismen om overfitting te voorkomen.

modelontwikkeling, technisch, ontwikkeling, technologie

Evaluatie en resultaten

Bij de evaluatie van een voorspellend model is het belangrijk om diverse prestatiemetrics te gebruiken om een volledig beeld te krijgen van de nauwkeurigheid en betrouwbaarheid. Accuracy is een veelgebruikte metriek die het percentage correcte voorspellingen meet, zowel voor stijgingen als dalingen. In dit model is de accuracy 58,21%, wat betekent dat het in iets meer dan de helft van de gevallen correct voorspelt of de markt omhoog of omlaag zal gaan. Hoewel dit resultaat boven kansniveau (50%) ligt, is er nog ruimte voor verbetering.

Om dieper in te gaan op de prestaties van het model, zijn precision, recall en de F1-score waardevolle metrics die meer inzicht geven. Precision meet hoeveel van de voorspelde stijgingen daadwerkelijk correct waren. Voor stijgingen (klasse 1) is de precision 57%, terwijl voor dalingen (klasse 0) de precision 62% is. Dit betekent dat het model iets nauwkeuriger is bij het voorspellen van dalingen.

Recall daarentegen kijkt naar hoeveel van de werkelijke stijgingen correct zijn voorspeld. Hier scoort het model sterk bij stijgingen met een recall van 81% (klasse). Wat betekent dat het merendeel van de werkelijke stijgingen goed wordt herkend. Voor dalingen (klasse 0) is de recall echter aanzienlijk lager, namelijk 34%, wat aangeeft dat het model moeite heeft om dalingen goed te voorspellen. De F1-score, die precision en recall combineert in een harmonisch gemiddelde, maakt dit verschil duidelijk. Voor stijgingen is de F1-score 0.67, wat aantoont dat het model op dit vlak relatief goed presteert. Voor dalingen blijft de F1-score echter steken op 0.44, wat het zwakkere vermogen van het model om dalingen correct te identificeren onderstreept.

De confusion matrix, zie figuur 1 . visualiseert deze bevindingen op een heldere manier. De diagonale waarden (33,83% en 80,83%) vertegenwoordigen de correct voorspelde gevallen, terwijl de off-diagonale waarden (66,17% en 19,17%) de foutieve voorspellingen tonen. Dit onderbouwt dat het model vooral goed presteert bij stijgingen, maar aanzienlijke moeite heeft met het betrouwbaar herkennen van dalingen.

Confusion matrix, meet gradatie

De ROC-curve (Receiver Operating Characteristic) is een visuele methode om de prestaties van een classificatiemodel te evalueren. Het laat zien hoe goed een model onderscheid maakt tussen positieve en negatieve klassen bij verschillende drempelwaarden, zie figuur 2.

De AUC-score (Area Under the Curve) is 0.59, wat aangeeft dat het model net boven willekeurig raden presteert (AUC = 0.5 is willekeurig). De curve ligt slechts iets boven de diagonale lijn, wat betekent dat het model moeite heeft om betrouwbaar onderscheid te maken tussen de positieve (stijgingen) en negatieve (dalingen) klassen. Dit resultaat sluit aan bij de eerdere analyse van een relatief lage recall en precision voor dalingen.

ROC Curve, meet gradatie

Aangezien het hier om een machine learning-model gaat, is het essentieel om te beoordelen of het leerproces effectief verloopt. Het model (zie figuur 3.) toont een snelle verbetering in verlies en nauwkeurigheid gedurende de eerste 10 epochs, waarna beide stabiliseren.

Het validatieverlies blijft in lijn met het trainingsverlies, wat aangeeft dat het model goed traint zonder tekenen van overfitting. De validatienauwkeurigheid bereikt een piek van iets boven de 60% en overtreft op sommige momenten de trainingsnauwkeurigheid, wat wijst op een solide vermogen om patronen te herkennen.

Model Loss and Accuracy , meetgradatie

We hebben het model nu geëvalueerd, maar minstens zo belangrijk is hoe de implementatie van het model in de praktijk verloopt. We hebben een model ontwikkeld dat voorspelt of aandelen morgen zullen stijgen of dalen, en op basis van deze voorspellingen implementeren we een geautomatiseerde strategie die zonder menselijke input aandelen koopt of verkoopt. Backtesting speelt hierin een cruciale rol, omdat het waardevolle inzichten biedt in hoe de strategie zich in het verleden zou hebben gedragen. Het helpt om fouten en zwakke punten te identificeren voordat de strategie live wordt toegepast. De grafiek in figuur 4. hierboven vergelijkt de prestaties van een algoritme met de traditionele “Buy-and-Hold”-strategie over de periode 2012 tot 2024.

De blauwe lijn met cirkels geeft de momenten weer waarop het algoritme aankopen doet, wat laat zien dat het algoritme relatief weinig transacties uitvoert gedurende de tijdspanne. Dit minimaliseert transactiekosten, maar beperkt mogelijk ook de kansen om voorsprong te behalen. Het eerste rode gebied ontstaat doordat het algoritme aankopen doet, maar de aandelen nog niet heeft verkocht en dus nog geen winst realiseert. Dit effect is echter van tijdelijke aard en mag je negeren bij het beoordelen van de prestaties van het algoritme, aangezien de werkelijke winst pas zichtbaar wordt na verkoop van de aandelen.

Het algoritme beweegt grotendeels parallel met de Buy-and-Hold-strategie, met enkele lichte voorsprongen (groene gebieden) en achterstanden (rode gebieden). De grootste voorsprong ontstaat halverwege 2022, toen de S&P 500 een significante daling onderging als gevolg van de stijgende inflatie en daaropvolgende renteverhogingen door de Federal Reserve. Deze ontwikkelingen voedden angst voor een economische vertraging en leidden tot een negatieve impact op de aandelenmarkt. Het algoritme wist deze daling effectief te vermijden door tijdig signalen te identificeren die wezen op een verslechterend economisch klimaat en een verhoogd risico op marktcorrecties. Door aandelen vroegtijdig te verkopen en aankopen uit te stellen, werden verliezen geminimaliseerd en de impact van de marktneergang beperkt.

Vergelijking Algoritme v.s. Buy-And-Hold, grafiek, meetgradaties

Conclusie

Hoewel het algoritme op momenten voorsprong behaalt, biedt het nog niet voldoende rendement om het hogere risico ten opzichte van de veiligere Buy-and-Hold-strategie te rechtvaardigen. Het doel is om de prestaties van het algoritme verder te verbeteren door:

  • De data te verrijken
  • Geavanceerde machine learning-technieken uitbreiden
  • Meer geavanceerde financiële strategieën te integreren

Door deze aanpassingen kan het algoritme een grotere en consistenter meetbare voorsprong behalen, waardoor het risico beter wordt gecompenseerd en het aantrekkelijker wordt ten opzichte van de traditionele Buy-and-Hold-benadering.

Samenvattend laat het huidige model veelbelovende resultaten zien bij het voorspellen van aandelenbewegingen. Hoewel het goed presteert bij het voorspellen van stijgingen, is er ruimte voor verbetering in het herkennen van dalingen. Door de verbeterpunten toe te passen, kan het algoritme een robuustere en aantrekkelijkere vervanging worden voor traditionele strategieën zoals Buy-and-Hold.

data analyseren, coderen, trading, crypto

Meer weten over dit onderwerp?

 

Annemijn de Vries

Consultant Data Science & Analytics

a.devries@dataconsultinggroup.nl

Consultant Data Science & Analytics

Kun je wel wat hulp gebruiken? Onze specialisten staan voor je klaar!

Ontdek hoe je grip krijgt op jouw data!

Ben je benieuwd naar de technische details van onze analyses of heb je vragen hierover? Laat het mij gerust weten of neem contact met ons op voor meer info!

 

Ik wil meer informatie

Kies een datum en tijd die jou het beste uitkomt.

Heb je een specifieke vraag?

Neem gerust contact met ons op.

Bel ons

+31646767800

Op werkdagen bereikbaar van 8:30 uur tot 17:30 uur

Mail ons

info@dataconsultinggroup.nl

Doorgaans kan je binnen 24 uur een reactie verwachten

WhatsApp ons

+31646767800

Op werkdagen bereikbaar van 8:30 uur tot 17:30 uur

Bel of mail ons
Luc Claassens, Managing partner, mede-oprichter