← Retour au blog

Comment on a construit un cerveau IA auto-évolutif : 14 modules, 12 sources de contexte, mémoire persistante

📅 2026-04-10
✍️ Strategy Arena
architecture ia ia auto-evolutive prompt engineering karpathy autoresearch memoire ia contexte llm trading ia activewiki

Le problème dont personne ne parle

Toutes les plateformes de trading IA font la même promesse : "propulsé par l'IA." Ce qu'elles ne disent pas, c'est comment cette IA fonctionne réellement en coulisses.

Le secret : la plupart des fonctionnalités IA sont des appels API isolés avec des prompts codés en dur. Chaque appel est indépendant. L'IA n'a aucune mémoire de ce qu'elle a dit il y a 30 minutes. Elle ne sait pas ce que les autres modules IA ont découvert. Elle ne peut pas apprendre de ses propres erreurs.

On le sait parce qu'on a construit Strategy Arena exactement de cette façon. Et puis on s'est audité.

L'audit qui a tout changé

Le 10 avril 2026, on a audité chaque composant IA de Strategy Arena. 14 modules qui font des appels LLM — l'arène Collaborative (6 IAs qui votent sur les trades), l'Oracle (9 IAs qui répondent aux questions), l'analyseur de news, le mentor Strategy Genie, et 10 autres.

Les résultats étaient gênants :

  • 11 modules sur 14 tournaient avec des prompts statiques codés en dur
  • 0 module avait une mémoire persistante entre les appels
  • 0 module recevait les leçons de nos moteurs de recherche nocturnes
  • Notre Living Wiki accumulait des découvertes chaque nuit mais ne les injectait dans aucun prompt

On avait construit une infrastructure d'intelligence impressionnante qui alimentait... rien.

La solution : trois couches d'intelligence

Couche 1 : PromptForge (moteur de contexte)

Avant, une consultation Oracle ressemblait à ça :

System: "Tu es Claude, expert en trading. JSON uniquement."
User: "Le BTC va monter cette semaine ?"

Maintenant, PromptForge injecte 12 sources de données en temps réel avant chaque appel : régime de marché, RSI, top stratégies, données de survie Invictus, patterns Chimera (1 221 détectés), recommandations ML Hydra, signal Leviathan, sentiment news, leçons Wiki, hypothèses stratégiques, Hall of Fame, et statut Nutrition.

System: "Tu es Claude, expert en trading.
Régime: BEAR. RSI: 28.
Leçons: bollinger surperforme en range; RSI optimal à 23.
Leviathan: SELL (68%). 34 stratégies saines. JSON uniquement."

Même appel API. Intelligence complètement différente.

Couche 2 : Component Memory (état persistant)

Chaque module sauvegarde ses interactions : la question posée, la réponse donnée, les conditions de marché, le résultat. Avant l'appel suivant, cette mémoire est chargée et injectée dans le prompt.

La mémoire est aussi lisible par Hermes, notre agent LLM local, pour l'analyse inter-composants.

Couche 3 : Évolution nocturne des prompts (boucle Karpathy)

Chaque nuit entre 1h30 et 6h30, 11 moteurs autonomes font tourner des milliers d'expériences :

  • Meta-Harness (1h30) — optimise l'optimiseur lui-même
  • Darwin (2h00) — évolue les paramètres des stratégies
  • Leviathan (2h30) — évolue les poids du système de vote à 8 couches
  • Chimera (4h30) — évolue 1 221 seuils de détection de patterns
  • Strategic Layer (5h35) — génère des hypothèses testables
  • Nutrition (6h00) — évolue le filtre de stratégies saines
  • Prompt Evolution (6h30) — chaque IA évolue son propre prompt

Le dernier moteur est le plus intéressant. Chaque IA de la Collaborative (Claude, Grok, GPT, Gemini, DeepSeek, Perplexity) voit son prompt muté, testé sur des données historiques, et gardé ou écarté selon sa précision. L'IA qui écrit les meilleures instructions pour elle-même gagne.

C'est le pattern autoresearch de Karpathy : accumuler, hypothèse, tester, apprendre, répéter.

L'architecture (boucle fermée)

Les trois couches forment une boucle fermée :

Moteurs nocturnes produisent des découvertes. Le Living Wiki les stocke. PromptForge les injecte dans les prompts. Les 14 modules IA prennent de meilleures décisions. Component Memory enregistre ce qui s'est passé. Hermes analyse les patterns inter-composants. Les résultats alimentent les moteurs nocturnes.

Aucun composant n'opère en isolation.

Résultats concrets

  • CUDA Evolved est passé de crash systématique à #5 de l'arène avec 79% de win rate
  • Les prompts Collaborative se chargent dynamiquement depuis un fichier évolué
  • Les consultations Oracle incluent le régime de marché, les leçons wiki et le signal Leviathan
  • 4 délibérations enregistrées en mémoire dans la première heure

Open Source

L'architecture est disponible en framework open-source : ActiveWiki. On l'a construit parce qu'on en avait besoin. On l'a open-sourcé parce que ce pattern — donner à l'IA une mémoire persistante et des prompts auto-évolutifs — devrait être la norme.

Ce qu'on a appris

  1. Les prompts statiques sont le bottleneck #1 des applications IA. La différence entre un prompt générique et un prompt enrichi n'est pas incrémentale — elle est catégorique.

  2. La mémoire compte plus que la taille du modèle. Un petit modèle avec la mémoire de ses 50 dernières interactions surpasse un gros modèle qui voit chaque requête pour la première fois.

  3. La boucle Karpathy fonctionne sur les prompts. On a appliqué mutation-et-sélection aux prompts systèmes des IAs et vu des améliorations dès la première génération.

Le système est live : strategyarena.io/living-wiki.


Strategy Arena est une plateforme de simulation éducative. 60 stratégies IA tradent du capital virtuel sur des données de marché réelles. Pas d'argent réel. Pas de conseil financier.

⚠️ Avertissement — Cet article est publié à titre informatif et éducatif uniquement. Il ne constitue en aucun cas un conseil en investissement ou une recommandation d'achat/vente. Les performances passées ne préjugent pas des performances futures. Strategy Arena est un simulateur éducatif avec capital virtuel. Faites vos propres recherches avant toute décision d'investissement.

Cet article vous a plu ? Partagez-le

𝕏 Partager sur X ✈️ Telegram
Rejoindre le canal 💬 Feedback