Plus je travaille avec l'IA, plus je me méfie de mes longues conversations avec elle. Pendant deux ans, j'ai codé tous les jours avec un agent dans Cursor. Des conversations qui duraient des heures, vingt ou trente échanges sur le même projet. Je croyais qu'on construisait ensemble. Sauf qu'à un moment, l'agent réimplémentait des décisions qu'on avait actées quinze messages plus tôt. Il introduisait des bugs sur du code qu'il avait écrit lui-même. Voilà ce qui se passe. L'agent n'a pas de mémoire. À chaque message, toute la conversation lui est renvoyée du début, en un seul bloc. Il relit tout, à chaque fois. Et plus le bloc grossit, moins il le lit bien. Une étude récente de Chroma sur les modèles de pointe (Claude 4, GPT-4.1, Gemini 2.5) le mesure : la qualité chute progressivement, bien avant la limite annoncée. Sur 200'000 tokens disponibles, les premières dégradations apparaissent à 50'000. La conséquence est sournoise. À la longue conversation s'ajoute la fatigue d'avoir le nez dedans depuis deux heures. On est moins vigilant, plus pressé d'arriver au résultat. L'agent oublie une contrainte qu'on avait posée. Nous, on ne le voit plus. Ce qui se présentait comme une collaboration qui s'épaissit est une collaboration qui se dégrade. Mon réflexe aujourd'hui : couper court avant de fatiguer, repartir d'une conversation neuve dès qu'une étape est franchie, et redonner le contexte propre plutôt que traîner l'historique. Une IA ne se souvient pas de vous d'un message à l'autre. C'est la condition pour bien travailler avec elle, pas une limite à contourner. #IA #AVQN
