Cet article sur le forecasting avec RL (apprentissage par renforcement) pour la prédiction est très intéressant.


Ce qu'il fait peut être compris ainsi :
Prenez un lot de questions de prédiction historiques dont les résultats sont déjà connus, et faites revenir l'IA au moment où elles ont été posées.
Mais il ne faut pas la laisser accéder à l'Internet d'aujourd'hui, sinon elle pourrait voir la réponse.
L'auteur a donc construit un environnement de « masque temporel » :
La recherche ne peut porter que sur les données antérieures à l'époque ;
Les pages web sont lues via des instantanés historiques ;
Les données financières et de tendance ne fournissent également que la partie visible à l'époque.
Ensuite, le modèle recherche lui-même les informations, évalue les preuves et produit une probabilité.
Une fois le vrai résultat connu, on lui attribue un score à l'aide d'une règle de notation appropriée (proper scoring rule), puis on utilise RL pour renforcer le meilleur processus de prédiction.
C'est ce qui est le plus intéressant :
Ce qui est entraîné n'est pas une réponse unique, mais toute une série d'actions de prédiction :
Quoi chercher, quoi lire, quand s'arrêter, comment traiter les preuves contradictoires, et finalement quelle probabilité donner.
Dans un marché de prédiction, selon moi, la première étape n'est pas de laisser l'IA trader automatiquement.
Il faudrait d'abord lui faire tenir un journal de prévisions (forecast diary) :
1. Probabilité à ce moment-là
2. Preuves utilisées
3. Prix du marché
4. Si on traderait ou non
5. Résultat ultérieur
6. Classification des causes d'erreur
Si un système dit « 60 % » mais qu'à long terme ce n'est pas 60 %, ce n'est pas encore une stratégie, mais juste savoir écrire des raisons.
Si vous voulez aussi vous entraîner à « enregistrer des prévisions → attendre le résultat → se calibrer », vous pouvez commencer par de petites sommes ou en simulation, en le traitant comme un journal de prévisions, et non comme un conseil de trading.
Le lien que j'utilise moi-même :

Voici le texte original :

Ce que je trouve le plus intéressant, ce n'est pas la conclusion elle-même, mais le fait qu'il décompose la « prédiction » en un processus qui peut être entraîné et analysé rétrospectivement.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épinglé