Business

Apprentissage automatique pour le day trading

Apprentissage automatique pour le day trading


1*LqrR M9oPTAfkLITn6pv A - Apprentissage automatique pour le day trading
Une scène de ‘Pi’

Dans cet article, je vais explorer les algorithmes d’apprentissage automatique pour l’analyse de séries chronologiques et expliquer pourquoi ils ne fonctionnent pas pour le day trading. Si vous êtes novice dans ce domaine, vous pourriez vous laisser tromper par des auteurs aux résultats étonnants, dans lesquels les données de test correspondent presque parfaitement aux prévisions. Une astuce courante consiste à afficher un graphique avec des valeurs prédites sur une longue période de données, ce qui donne l’illusion que le décalage est insignifiant ou que vous ne le verrez pas du tout. Lag est ce qui rend les prédictions inutiles et je vais vous montrer un exemple plus tard dans ce post. Il existe d’autres moyens de rendre légitimes les prédictions, dont certaines sont sûrement faites par erreur. Mais ne vous découragez pas et gardez à l’esprit que le modèle peut être aussi performant que vos données, et son absence est la principale pierre d'achoppement pour obtenir des résultats concrets.

Le day trading est le processus d'achat et de vente d'actions en une journée. Cela pourrait être aussi simple que d’acheter les actions d’une entreprise le matin et de les vendre en fin de journée (16 heures pour être précis). Bien que la loi elle-même soit simple, elle nécessite beaucoup d’expérience et d’informations pour pouvoir acheter le stock approprié qui va probablement augmenter. Le day trading est très risqué en raison du comportement à court terme de marchés reflétant des milliards de valeurs fluctuant rapidement en réponse à l'évolution de la situation qui se rapproche d'une marche aléatoire. Plus de 95% des commerçants perdent de l'argent.

Configuration de petite négociation

Le trading nécessite beaucoup d'attention et de sensibilité envers le marché. Les traders expérimentés s'appuient sur de multiples sources d'informations, telles que des actualités, des données historiques, des rapports de gain et des initiés. Le risque est élevé et de nombreuses variables doivent être prises en compte. Pour cette raison, certaines institutions financières ne comptent que sur des machines pour effectuer des transactions. Cela signifie qu'un ordinateur avec des connexions Internet à haut débit peut exécuter des milliers d'opérations au cours d'une journée, en tirant un bénéfice d'une petite différence de prix. C'est ce qu'on appelle le trading haute fréquence. Aucun humain ne peut rivaliser avec ces algorithmes, ils sont extrêmement rapides et plus précis.

L’inconvénient de cette approche est qu’une personne moyenne n’a peut-être pas accès à de tels instruments ou qu’elle coûte beaucoup trop cher. Cependant, sur les plateformes de trading telles que Robinhood ou TD Ameritrade, toute personne peut jouer en bourse à partir de son ordinateur ou de son smartphone. Et vous n’avez même pas à payer de frais de courtage, ce qui le rend très attrayant pour les débutants.

En tant qu'étudiant en informatique, j'étais très enthousiaste à l'idée d'essayer différents algorithmes d'apprentissage automatique et de répondre à la question suivante: l'apprentissage automatique peut-il être utilisé pour prédire l'évolution du marché boursier?

Finance.yahoo.com est l'un de mes endroits préférés pour obtenir des informations sur les marchés et les sociétés cotées en bourse. Vous pouvez afficher des données historiques avec des indicateurs techniques, lire des informations sur les états financiers de l'entreprise, des actualités, etc.

J'ai sélectionné des sociétés de technologie du marché NASDAQ qui m'intéressent personnellement. Pour le projet, j'ai construit plusieurs indicateurs techniques d'une manière similaire à celle que vous trouverez dans Yahoo Finance. Jetons un coup d’œil aux données historiques de Tesla pour avoir une idée de ce à quoi nous sommes confrontés.

Le prix ne laisse presque jamais de place aux bandes de Bollinger. Cela nous indique que le prix monte et descend entre deux écarts-types. Nous pouvons utiliser cet indicateur pour indiquer quand acheter ou vendre un stock.

La divergence de convergence de la moyenne mobile (MACD) est un indicateur de momentum qui montre la relation entre deux moyennes mobiles du prix d’un titre. Habituellement, lorsque MACD (ligne violette) dépasse Signal (ligne orange), cela signifie que le stock est à la hausse et qu'il continuera à augmenter pendant un certain temps.

L'indice de force relative (RSI) est un autre indicateur de momentum qui permet de savoir si le stock est suracheté ou sur-vendu. Il varie de 0 à 100, mais en général, nous sommes attentifs lorsque l'indice approche 20 et ce serait un signal d'achat. Si elle approche les 80, mieux vaut la vendre rapidement.

La visualisation aide à comprendre le fonctionnement des indicateurs techniques et leurs forces ou faiblesses. Passons maintenant à la partie apprentissage automatique, où toute la magie se produit.

Le modèle ARIMA (moyenne mobile intégrée auto-régressive) est utilisé pour prédire les données de séries chronologiques en supposant que les points de données sont corrélés les uns aux autres. Si les données ne sont pas corrélées, le modèle ne pourra pas faire de prédiction. La fonction de corrélation automatique (ACF) indiquera si les points de données ont ce type de relation. Voyons l’intrigue:

ACF

Les points de données ne sont en effet pas corrélés. Par conséquent, utiliser ARIMA pour prédire les valeurs futures n’est pas raisonnable. Ne pas afficher les fameuses prédictions décalées serait un crime, alors voici:

C’est tout ce que nous avons besoin de savoir ici, passons aux réseaux de neurones plus prometteurs.

Lorsque les négociants utilisent des données historiques ainsi que des indicateurs techniques pour prédire le mouvement des stocks, ils recherchent des modèles familiers. Certains types de réseaux de neurones sont parfaits pour trouver des modèles et ont diverses applications en reconnaissance d'image ou en traitement de test.

Premièrement, j'ai essayé un réseau de convolution pour reconnaître les modèles de données historiques. Il peut prendre un certain nombre de fonctionnalités et en tirer des enseignements simultanément. Dans cet exemple, le réseau devait apprendre des séquences de 21 jours et prévoir le retour des actions le lendemain. Par retour, j'entends une différence de prix au début et à la fin de la journée. Si le prix montait - le rendement est positif, à la baisse - négatif.

Alors, comment s'est-il comporté? Le réseau était enclin à suralimenter, ce qui signifie qu’il avait très bien appris les modèles dans les données du train mais n’avait pas pu prédire de manière significative les données de test. La précision était aussi bonne qu'une supposition aléatoire.

Surapprentissage (précision: 80%)

Les réseaux récurrents (LSTM) sont également efficaces pour l’apprentissage à partir de données séquentielles, c’est-à-dire des séries chronologiques. Avec la même longueur de séquence et le même nombre de fonctionnalités, le réseau n’a pas pu apprendre les données.

Regardons les prédictions. Le réseau a emprunté une voie facile et a décidé que le retour quotidien serait négatif. C'était juste environ 50% du temps.

J’ai essayé des centaines de combinaisons d’architecture réseau, le nombre de fonctionnalités, la longueur des séquences, le réglage des hyperparamètres, la prévision du jour, de la semaine ou du mois suivant. Les résultats étaient aussi bons qu'une supposition aléatoire.

De toute évidence, les réseaux de neurones ne fonctionneraient pas ici non plus.

L'idée de cette technique est de prendre une séquence de 9 jours dans l'ensemble d'essai, de rechercher des séquences similaires dans l'ensemble de trains et de comparer leur retour le 10ème jour. Si un algorithme trouve plus d'une séquence, il fait simplement la moyenne du résultat. Voyons le processus:

Une ligne rose est une séquence de 9 jours de l'ensemble de test. L'algorithme a trouvé 5 correspondances, trois d'entre elles ont un rendement positif le dixième jour, deux négatives. En moyenne, nous avons un rendement positif en tant que prédiction. Identique au retour réel de l'ensemble de test. Ça marche.

Mais passer à travers des ensembles de tests de correspondance complets m'a donné une précision d'environ 50%. La magie n’a pas eu lieu ici aussi.

Photo de Kristopher Roller

Aucune de mes techniques n'a fonctionné, mais si vous voulez toujours gagner de l'argent sur le marché boursier, il existe une alternative au day trading. Une approche classique consistant à utiliser des indicateurs techniques peut offrir de bons rendements sur les investissements à court terme - elle varie de quelques jours à environ un mois. Voici comment cela fonctionne: J'ai simulé une stratégie de trading en utilisant seulement deux indicateurs: les bandes de Bollinger et le MACD. La plupart des indicateurs racontent la même histoire car ils utilisent les mêmes données historiques: prix ou volume. Pour cette raison, je ne les ai pas combinées mais utilisées séparément.

J'ai fait une simulation comme si vous achetiez des actions lorsque le prix approchait de la fourchette inférieure et vice versa. Au début de 2018, l'algorithme disposait de 15 000 USD pour investir dans Tesla. À la fin de l’année, il n’a pu générer que 19% de bénéfices.

Les groupes Bollinger ont très bien fonctionné sur Tesla, mais pas sur d’autres actions. Amazon, par exemple, a eu un retour négatif. Donc ce n’est pas parfait, mais cela a fonctionné sur la plupart des actions que j’ai essayées (19 au total).

Le MACD, d’autre part, a fait bien pire. Cela m'a fait penser que cela pourrait être un bon complément aux bandes de Bollinger ou à d'autres indicateurs, mais pas seul.

Un grand avantage de ce projet est que le marché boursier est un système très complexe et qu’expliquer son comportement avec des données historiques ne suffit pas. Les algorithmes d’apprentissage automatique y voient une marche aléatoire ou un bruit blanc. Analyse fondamentale, analyse Twitter, analyse de l'actualité, analyse de l'économie locale / mondiale - de telles choses peuvent potentiellement améliorer les prévisions.

Le référentiel de projet vit ici.

Merci pour la lecture,

Arseniy.

Image faite par Microsoft stock data
Afficher plus

SupportIvy

SupportIvy.com : Un lieu pour partager le savoir et mieux comprendre le monde. Meilleure plate-forme de support gratuit pour vous, Documentation &Tutoriels par les experts.

Articles similaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer