25% de corruption : quand l'IA de Microsoft sabote ses propres workflows

Une étude interne de Microsoft révèle que les IA corrompent 25% du contenu documentaire en moyenne, avec des erreurs silencieuses qui s'accumulent sur les workflows longs.

20 mai 2026
25% de corruption : quand l'IA de Microsoft sabote ses propres workflows
‘LLMs are unreliable delegates’: Microsoft researchers say you probably shouldn’t trust AI with work documents
A research paper from Microsoft shows AI degrades documents over longer workflows

Cette recherche interne de Microsoft fait exploser un paradoxe : l'entreprise qui pousse ChatGPT et Copilot dans nos workflows démontre elle-même que ses IA corrompent massivement les documents. Les modèles les plus performants (GPT, Gemini, Claude) dégradent en moyenne 25% du contenu, certains modèles dépassant les 50%. Le problème systémique réside dans l'accumulation d'erreurs silencieuses : chaque interaction introduit des suppressions de données et des hallucinations qui se composent sur les workflows longs.

"Notre analyse montre que les modèles de langue actuels sont des délégués peu fiables : ils introduisent des erreurs rares mais sévères qui corrompent silencieusement les documents, s'aggravant sur de longues interactions [traduit de l'anglais]"

— Philippe Laban, Tobias Schnabel, Jennifer Neville, Chercheurs, Microsoft

Cette contradiction révèle un décalage entre le marketing des agents IA ("déléguez-nous vos tâches") et la réalité technique documentée par les propres chercheurs. L'enjeu dépasse la performance : il touche à la fiabilité fondamentale des systèmes sur lesquels on construit nos organisations.

Points de vigilance

Risque de focalisation sur les performances techniques plutôt que sur la gouvernance des décisions d'adoption. Attention aux solutions cosmétiques (meilleur fine-tuning) qui évitent la question de fond : faut-il déléguer ces tâches ?

Pas de mur payant, pas d'abonnement. Si ces analyses te sont utiles, tu peux me soutenir, librement, au montant de ton choix. C'est ce qui permet d'en produire davantage et de garder l'accès ouvert à tous. Déjà un grand merci 🙏

Et maintenant ?

  • 🤘 Créer un observatoire indépendant de fiabilité des agents IA

Coalition chercheurs + syndicats tech + ONG pour documenter publiquement les taux d'erreur des IA en production. Publier des benchmarks standardisés sur la corruption documentaire, forcer la transparence des vendeurs sur les limites réelles de leurs systèmes.

→ On saura que ça marche quand les entreprises publieront des taux d'erreur standardisés comme obligation légale avant déploiement d'agents IA.

  • 💪 Auditer ses propres workflows avant d'introduire des agents IA

Cartographier les points de défaillance critique dans ses processus documentaires. Tester systématiquement sur des échantillons avant adoption généralisée. Créer des protocoles de vérification croisée humain-machine plutôt que la délégation aveugle.

→ On saura que ça marche quand les organisations exigeront des audits de fiabilité comme prérequis d'achat d'agents IA.

  • ✊ Organiser un moratoire collectif sur l'adoption d'agents IA critiques

Coalition d'organisations refusant de déployer des agents IA sur les processus documentaires critiques tant que les taux d'erreur dépassent 5%. Créer une certification alternative basée sur la fiabilité plutôt que la performance, fragiliser le narratif marketing des Big Tech.

→ On saura que ça marche quand Microsoft et OpenAI publieront des garanties de fiabilité contractuelles pour éviter l'exode client.


8/10 : Score sur l'échelle des "5 piliers de la liberté", inspiré de l'ouvrage de Timothy Snyder
Framework #FLTR — Note méthodologique
Protocole de production et de publication dont la ligne éditoriale est codée dans l’ADN-même du projet. Cette architecture auto-apprenante transforme une intention humaine en contraintes techniques, imposées tant aux outils d’intelligence artificielle qu’aux humains qui les entrainent, et vice-versa

Ces pistes ne sont pas des recettes toutes faites, mais des points d'entrée pour repenser nos systèmes numériques selon une logique de liberté positive : non pas limiter, mais augmenter nos capacités collectives d'action.

Le règlement européen sur l'IA exclut explicitement la sécurité nationale de son périmètre. En Belgique, aucun cadre législatif ne régit aujourd'hui l'utilisation de l'intelligence artificielle par la Défense ou la Police fédérale. La pétition déposée à la Chambre demande trois choses concrètes : un inventaire des systèmes IA déjà déployés, des standards nationaux minimaux, et un positionnement parlementaire sur la surveillance de masse et les armes autonomes.

Comment agir ? La pétition nécessite 25 000 signatures, réparties entre la Flandre, la Wallonie et Bruxelles, pour déclencher un examen parlementaire. C'est un mécanisme démocratique existant — il suffit de l'activer. Signer prend moins d'une minute sur le site de la Chambre

56_2025-2026/60 - IA militaire en Belgique : transparence et règles — demande de contrôle parlementaire - 56_2025-2026/60 - IA militaire en Belgique : transparence et règles — demande de contrôle parlementaire - Pétitions - Petities
L’AI Act européen exclut la sécurité nationale de son champ. Aucun texte belge n’encadre donc l’usage de l’IA par la Défense nationale et la Police fédérale.Je demande à la Chambre d’adopter une résolution pour :(1) obtenir du gouvernement un état des lieux des systèmes IA déployés et de leurs garanties contractuelles ; (2) fixer des règles nationales minimales ; et (3) se prononcer sur l’usage de l’IA pour la surveillance de masse et les armes sans supervision humaine.

💬 On en discute ?

Tu veux recevoir le flux quotidien des articles publiés sur le site ? Suis-moi sur LinkedIn, Bluesky, Mastodon, Facebook ou rejoins-moi sur Discord !

Tu as des remarques, des suggestions, ou tu veux discuter d'une idée pour avancer dans tes propres projets ? Connecte-toi et laisse-moi un commentaire ou jette un oeil directement à mon agenda. 📆