Comment utiliser l’IA pour trader ?

S’il n’est pas possible d’expliquer toutes les décisions d’un algorithme de reinforcement learning, comment l’utiliser pour améliorer la gestion de portefeuille ?

Le gestionnaire de portefeuille se heurte à la problématique suivante : “si je prends trop de risque et que les marchés baissent, les clients ne seront pas contents d’avoir perdu de l’argent. Si maintenant, je ne prends pas assez de risque et que les marchés montent, mon client me dira que j’ai fait moins bien que le marché.” La relation client et la pédagogie sont donc au centre même du métier de gestionnaire. Il n’est donc pas souhaitable de remplacer l’humain par un algorithme. Pour autant, le reinforcement learning peut apporter beaucoup. Mais il faut déjà déterminer à quelle échelle de temps. 

L’intelligence artificielle et la problématique du temps

Le trading algorithmique a beaucoup fait parler de lui ces dernières années notamment au travers du trading haute fréquence. Il s’agit de prendre des décisions en quelques nanosecondes pour tirer parti d’une information avant les autres. 

La problématique du trading haute fréquence est avant tout une problématique de matériel. Il faut que le système tourne sans bugs, avec une connection internet excellente, H24. On pourrait résumer simplement la problématique du trading haute fréquence à une problématique IT. Impossible de faire de l’intelligence à ce niveau, le temps de calcul nécessaire au reinforcement learning variant entre la minute et la journée.

De l’autre côté de la balance, sur le long terme, mieux vaut se reposer sur l’humain. Découvrir de nouvelles tendances dans les données est compliqué pour un algorithme. Certaines entreprises ou trackers n’ont que quelques années d’historiques, trop peu. Il faut également prendre en compte la perception d’une information par les autres et faire preuve d’empathie pour comprendre par exemple la sensibilité accrue des jeunes générations aux problématiques environnementales. L’humain est donc nécessaire pour brasser un ensemble de données d’univers plus variés et construire une opinion.

La plus value du reinforcement learning se situe sur une échelle de temps intermédiaire : entre la journée et le mois. Un laps de temps sur lequel la machine peut traiter des quantités d’informations monstrueuses en un temps raisonnable. D’un côté, l’algorithme analyse plus de cas qu’un algorithme de haute fréquence et apporte une dose d’intelligence. De l’autre, il peut analyser beaucoup plus vite qu’un humain et déceler des tendances courts termes. 

Partie dédiée à l’humain 

Je n’aurais de cesse de le répéter : l’intelligence artificielle est loin d’être intelligente. Elle traduit le passage de l’exécution d’une instruction claire comme de l’eau de roche à un calcul de probabilité sur un grand jeu de données. Ainsi, déceler les tendances de long terme est compliqué pour le reinforcement learning. Il faut lui fournir un objectif. Le gestionnaire a donc pour rôle de sélectionner les valeurs dans lesquelles investir. Les bons traders ont le flair pour trouver les bonnes opportunités. Là où les choses se compliquent, c’est quand il faut déterminer précisément quel montant investir, à quel moment précis le faire et quand sortir de sa position. 

Le gestionnaire a aussi en charge la question de la réglementation et de la prise en compte de scénarios extrêmes. La plus value de l’humain sur ce périmètre est sa capacité à définir des contraintes. Définir des contraintes permet de définir le périmètre dans lequel l’IA à le champ libre. Ces contraintes permettent d’intégrer la régulation et de définir les zones rouges à ne pas franchir pour maintenir une relation de confiance. Plutôt que de contrôler chaque décision dans lequel l’IA agit, on définit un périmètre de sécurité et on laisse l’IA agir librement dans ce périmètre. Ces contraintes de sécurité peuvent être du type : conserver une certaine quantité de cash ou imposer une limite sur l’exécution des ordres si les prix ont trop déviés par rapport aux données.

Le reinforcement learning comme aide à la prise de décision

Une fois le cadre de sécurité posé, à quoi peut donc bien servir la machine ? L’intelligence artificielle prend son sens au niveau calculatoire pour aider à déterminer les quantités à acheter et à vendre à court terme, le meilleur moment pour entrer sur le marché bref, comparer une décision sur des milliers de scenarii pour réaliser le meilleur choix. Le reinforcement learning peut donc aider à anticiper des achats et reventes sur plusieurs jours dans le futur. 

Pour comprendre vraiment tout le potentiel du reinforcement learning, Imaginons un exemple simple, où chaque jour le court d’une action peut soit monter de 1%,  soit rester stable, soit chuter de 1%. Si l’on veut pouvoir évaluer l’impact d’une décision sur 10 jours, soit deux semaines de trading, cela représente environ 100 000 scénarios. Impossible pour un humain de répéter cette action jour après jour. Un algorithme de reinforcement learning lui, le peut. 

Il peut également rejouer des scénarios pré-enregistrés et défavorables pour éviter de répéter des erreurs passées.

Boucle d’interaction de suivi 

Finalement, humain et machine coopèrent. L’humain revoit les objectifs long termes et le contenu de son portefeuille chaque trimestre ou chaque année. La machine, elle, se charge d’effectuer le suivi au jour le jour pour optimiser le rapport rendement risque à court terme.

Pour ceux familiers de la méthode Objectif & Key results, on peut y voir un parallèle. L’humain décide de l’objectif qualitatif à moyen terme et la machine se charge de réaliser les objectifs quantitatifs à court terme.

Il nous reste cependant une question à traiter. Si les contraintes de régulations sont les mêmes pour tout le monde, chaque gestionnaire a sa propre personnalité et chaque client également. La perception du risque n’est donc pas universelle. Comment l’intégrer dans l’intelligence artificielle ?


Suggestions d'articles