Rongchai Wang
24 janv. 2026 00:07
EigenAI atteint 100 % de sorties LLM reproductibles sur GPU avec moins de 2 % de surcharge, permettant des Agents d'IA autonomes vérifiables pour le trading et les marchés de prédiction.
EigenCloud a publié sa plateforme EigenAI sur le mainnet, affirmant résoudre un problème fondamental qui afflige les systèmes d'IA autonomes : vous ne pouvez pas vérifier ce que vous ne pouvez pas reproduire.
La réalisation technique ici est significative. EigenAI fournit une inférence déterministe bit-exacte sur des GPU de production—ce qui signifie que des entrées identiques produisent des sorties identiques sur 10 000 exécutions de Test automatique—avec seulement 1,8 % de latence supplémentaire. Pour quiconque construit des Agents d'IA qui gèrent de l'argent réel, cela compte.
Pourquoi l'aléatoire des LLM brise les applications financières
Exécutez la même demande via ChatGPT deux fois. Réponses différentes. Ce n'est pas un bug—c'est ainsi que fonctionne le calcul en virgule flottante sur les GPU. La planification du noyau, le traitement par lots variable et l'accumulation non associative introduisent tous de minuscules variations qui se cumulent en différentes sorties.
Pour les chatbots, personne ne le remarque. Pour un Agent d'IA de trading exécutant avec votre capital ? Pour un oracle de marché de prédiction décidant qui gagne 200 millions de dollars en paris ? L'incohérence devient un handicap.
EigenCloud pointe le tristement célèbre marché de Polymarket « Zelenskyy portait-il un costume ? » comme étude de cas. Plus de 200 millions de dollars de volume, des accusations de résolution arbitraire, et finalement la gouvernance humaine a dû intervenir. Alors que les marchés évoluent, l'arbitrage humain ne le fait pas. Un juge d'IA devient inévitable—mais seulement si ce juge produit le même verdict à chaque fois.
La pile technique
Atteindre le déterminisme sur les GPU nécessitait de contrôler chaque couche. Les puces A100 et H100 produisent des résultats différents pour des opérations identiques en raison de différences architecturales dans l'arrondi. La solution d'EigenAI : les opérateurs et vérificateurs doivent utiliser des SKU GPU identiques. Leurs tests ont montré un taux de correspondance de 100 % sur des exécutions de même architecture, 0 % entre architectures.
L'équipe a remplacé les noyaux cuBLAS standard par des implémentations personnalisées utilisant des réductions synchrones de warp et un ordre de threads fixe. Pas d'atomiques en virgule flottante. Ils ont construit sur llama.cpp pour sa base de code petite et auditable, désactivant la fusion de graphe dynamique et d'autres optimisations qui introduisent de la variabilité.
Le coût de performance s'établit entre 95 et 98 % du débit cuBLAS standard. Les tests inter-hôtes sur des nœuds H100 indépendants ont produit des hachages SHA256 identiques. Des tests de stress avec des charges de travail GPU en arrière-plan induisant des variations de planification ? Toujours identiques.
Vérificaiton par l'économie
EigenAI utilise un modèle de Vérificaiton optimiste emprunté aux rollups blockchain. Les opérateurs publient des résultats chiffrés sur EigenDA, la couche de disponibilité des données du projet. Les résultats sont acceptés par défaut mais peuvent être contestés pendant une fenêtre de litige.
En cas de contestation, les vérificateurs réexécutent à l'intérieur d'environnements d'exécution de confiance. Parce que l'exécution est déterministe, la Vérificaiton devient binaire : les octets correspondent-ils ? Les incohérences déclenchent une réduction du stake cautionné. L'opérateur perd de l'argent ; les contestataires et vérificateurs sont payés.
La conception économique vise à rendre la triche à valeur attendue négative une fois que la probabilité de contestation dépasse un certain seuil.
Ce qui se construit maintenant
Les applications immédiates sont simples : des arbitres de marchés de prédiction dont les verdicts peuvent être reproduits et audités, des agents de trading où chaque décision est enregistrée et contestable, et des outils de recherche où les résultats peuvent être évalués par les pairs par réexécution plutôt que par confiance.
La tendance plus large ici s'aligne sur l'intérêt croissant des entreprises pour l'IA déterministe dans les secteurs à forte conformité. Les applications de santé, de finance et juridiques exigent de plus en plus le type de reproductibilité que les systèmes probabilistes ne peuvent garantir.
Reste à voir si la surcharge de 2 % d'EigenAI s'avère acceptable pour les applications à haute fréquence. Mais pour les agents autonomes gérant un capital important, la capacité de prouver l'intégrité de l'exécution peut valoir la taxe sur les performances.
Le livre blanc complet détaille l'analyse de sécurité formelle, les spécifications de conception du noyau et les mécanismes de réduction pour ceux qui construisent sur l'infrastructure.
Source de l'image : Shutterstock
Source : https://blockchain.news/news/eigenai-deterministic-inference-mainnet-launch

