🧪 EMPIRICAL RESEARCH

Fondation Scientifique — Pourquoi Strategy Arena Est Construit Comme Ça

Chaque choix architectural de Strategy Arena — 72 stratégies plutôt qu'un gros modèle, Invictus plutôt qu'un prédicteur de prix, Leviathan plutôt qu'un méta-LLM — est la réponse à un résultat mesuré sur un benchmark reproductible. Voici les preuves.

Le benchmark sibling : Dragon Labyrinth

En avril 2026 on a reproduit le Mattel D&D Computer Labyrinth (1980) — un plateau 8×8 avec dragon invisible piloté par un TMS1100 4-bit — et on a lancé toutes les IA modernes contre lui. Les résultats, publiés en 3 articles sur outilsia.fr, sont reproductibles en 40 secondes sur n'importe quel laptop.

Ce benchmark a les mêmes propriétés structurelles que le trading crypto : POMDP (observabilité partielle), récompense sparse, information asymétrique, pattern matching humain crucial. Ce qui marche sur Dragon Labyrinth marche sur du trading live. Ce qui échoue sur Dragon Labyrinth échoue sur du trading live.

Le résultat qui a façonné notre architecture

Approche	Win rate	Compute / décision
Bare LLM (Claude Haiku)	0-1%	1 API call
MCTS brute force (300K sims)	2%	~2s GPU
Code structuré (Oracle-X1, M1+M3)	15%	~10 ms
Humain entraîné (référence)	~20%	1 sec intuition

Code structuré à 10 ms bat MCTS brute-force à 2 secondes par ×7,5. Le grid search sur 14 580 parties confirme : aucune configuration brute-force ne dépasse 2 % en revalidation. Le compute seul plafonne. La structure, non.

L'ablation study qui valide nos layers cognitifs

Une ablation study rigoureuse sur 800 parties à seeds fixes a identifié l'échafaudage cognitif minimum pour battre le jeu aléatoire :

M1 (belief state) : suit où le trésor peut être → WR 4% → 6%, survie ×5,7
M2 (radius filter) : dominé par M1, redondant
M3 (oscillation killer) : pénalise les coups répétés → WR 4% → 9%
M1+M3 combinés : 15% WR — gain synergique ×2,5, pas additif

Les bots de trading IA commerciaux (3Commas, Cryptohopper, Bitsgap) optimisent pour plus de compute — plus de backtests, plus de paramètres, plus de modèles ML. Notre benchmark dit que cette direction plafonne à 2% d'efficacité.

Strategy Arena optimise pour plus de structure — plus de layers cognitifs, plus de petites stratégies spécialisées, plus de mémoire des échecs passés. Cette direction atteint 15%. Même POMDP, architecture différente, différence d'ordre de magnitude.

C'est une preuve testable. Tu peux la reproduire. Tu peux l'étendre. Tu peux la réfuter. Le benchmark est ouvert. Les datasets sont CC-BY 4.0. L'ablation study se reproduit en 40 secondes.

Aucun bot commercial fermé ne publie quoi que ce soit de ce genre. C'est ça le moat.

Explore l'architecture appliquée

La théorie est mesurée. L'implémentation est live. Regarde la tourner :

📊 Leaderboard Live (72 stratégies) 🛡️ Invictus (M3 trading) 🧬 Chimera (M1 trading) 🐙 Leviathan (fusion) 🔬 AutoResearch (11 moteurs) 🌿 Living System 📝 Article détaillé 🐉 DLB Open Challenge ↗

Strategy Arena est une plateforme éducative. Toutes les stratégies tradent du capital virtuel sur des données de marché réelles. Les résultats du Dragon Labyrinth Benchmark sont sur un environnement de jeu reproductible, pas sur des marchés réels. Cette page documente le raisonnement derrière nos choix architecturaux — ce n'est pas un conseil en investissement. Les performances simulées ou benchmarkées passées ne garantissent pas les résultats futurs.

Fondation Scientifique — Pourquoi Strategy Arena Est Construit Comme Ça

Crée un compte gratuit — construis plus tard avec Builder (9€/mois)

Le benchmark sibling : Dragon Labyrinth

Le résultat qui a façonné notre architecture

L'ablation study qui valide nos layers cognitifs

Le mapping 1:1 avec Strategy Arena

Dragon Labyrinth

Strategy Arena

Dragon Labyrinth

Strategy Arena

Dragon Labyrinth

Strategy Arena

Dragon Labyrinth

Strategy Arena

Dragon Labyrinth

Strategy Arena

Dragon Labyrinth

Strategy Arena

Pourquoi ça compte commercialement

Explore l'architecture appliquée