Le dernier protocole

Il y a sept mois, j'écrivais que MCP allait dévorer le monde. Je décrivais cinq couches — Traduction, Mémoire, Agentivité, Synthèse, Émergence — et prédisais que les agents deviendraient les principaux habitants de nos infrastructures de communication d'ici trois ans.

Puis le silence. Non pas parce que la thèse s'était effondrée. Parce que je m'étais mis à construire.

Pendant que je livrais, tête baissée, un serveur MCP pour les enregistrements vocaux, l'industrie a passé l'hiver à se demander si MCP était l'avenir ou une impasse. Le CTO de Perplexity a annoncé lors d'Ask 2026 qu'ils abandonnaient MCP en interne, invoquant 72 % de gaspillage de contexte et des frictions d'authentification. Garry Tan a qualifié le protocole de déchet. Cloudflare a publié une analyse technique montrant que l'appel d'outils consomme 81 % de la fenêtre de contexte en overhead d'instructions.

Pendant ce temps : 97 millions de téléchargements mensuels du SDK. OpenAI l'a adopté. Google l'a adopté. Anthropic continue de livrer des mises à jour.

Les deux camps ont raison. Les deux camps regardent au mauvais endroit.

Quand l'ordinateur a appris à utiliser l'ordinateur

Quelque chose a basculé pendant que tout le monde se disputait. Le CLI est devenu bon.

Pas bon de manière incrémentale. Catégoriquement différent. Claude peut exécuter des commandes shell. GPT peut exécuter du code. Codex lance des environnements sandboxés, installe des dépendances, exécute des suites de tests et pousse des commits sans qu'un humain ne tape un seul caractère. L'ordinateur a appris à utiliser l'ordinateur.

Voici ce que personne ne veut dire tout haut : l'AGI est arrivée sous forme de session shell. Pas sous forme de livre blanc, de benchmark ou de communiqué de presse. Un curseur qui clignote dans un terminal, accomplissant un travail qui nécessitait auparavant un ingénieur senior, un chef de projet et un sprint de deux semaines.

Le débat MCP contre CLI, c'est en réalité le débat GUI contre CLI qui a changé de costume. MCP vous offre des schémas structurés, la découverte de services, le streaming, des informations de typage riches. L'interface graphique de la communication agent-service. Le CLI vous offre les pipes Unix, cinquante ans de composabilité, un overhead quasi nul, une exécution instantanée. L'un est plus élégant. L'autre est plus rapide.

Vous savez déjà comment ça se termine, parce que vous l'avez vu se jouer pendant des décennies. VS Code n'a pas tué Neovim. Neovim n'a pas tué VS Code. Ils coexistent parce qu'ils résolvent des problèmes différents pour des opérateurs différents, et la capacité sous-jacente — éditer du texte, exécuter du code, gérer des projets — est identique.

MCP et CLI sont tous deux des enveloppes autour d'API. L'un ajoute une couche de découverte et de typage. L'autre n'ajoute rien et s'exécute en deux millisecondes. Débattre de qui va « gagner » revient à se demander si HTTP ou FTP va « gagner Internet ». Ni l'un ni l'autre. TCP/IP avait déjà gagné, et tout le reste n'est qu'une couche de confort par-dessus.

L'abstraction n'a pas d'importance. La plomberie, si.

Perplexity avait raison (pour son produit)

Denis Yarats n'avait pas tort sur les 72 % de gaspillage de contexte. Quand vous faites tourner un moteur de recherche à l'échelle de Perplexity — des millions de requêtes, chacune devant être rapide, économique et exacte — vous ne pouvez pas vous permettre de charger une centaine de descriptions d'outils dans la fenêtre de contexte juste pour déterminer lequel appeler. C'est une contrainte d'ingénierie réelle, pas une objection philosophique.

Mais Perplexity construit un produit de recherche. Leurs agents sont éphémères. Ils démarrent, exécutent une chaîne de requêtes, renvoient des résultats et meurent. Pour cette charge de travail, l'overhead de découverte de MCP est véritablement du gaspillage. Vous n'avez pas besoin que le protocole indique à votre agent quels outils existent quand vous avez déjà codé en dur les trois outils qu'il utilisera jamais.

L'erreur, c'est de généraliser « MCP est inefficace pour notre moteur de recherche » en « MCP est inefficace ». C'est comme regarder une écurie de Formule 1 retirer la climatisation de sa voiture et en conclure que la climatisation est morte. Non. Vous n'avez simplement pas besoin de clim quand tout votre modèle opérationnel consiste à aller vite dans une seule direction pendant quatre-vingt-dix minutes.

Les charges de travail où MCP prend tout son sens sont l'exact opposé de celles de Perplexity : des agents persistants, des sessions longue durée, des contextes qui accumulent de la valeur au fil du temps. Un agent de code qui maintient un modèle mental de l'intégralité de votre codebase. Un assistant pédagogique qui se souvient de six mois d'enregistrements vocaux d'étudiants. Un orchestrateur qui gère dix sous-agents répartis sur trois surfaces de communication.

L'overhead de découverte est coûteux quand la découverte se produit à chaque requête. Il est négligeable quand elle se produit une seule fois et que l'agent vit pendant des mois.

Notes vocales, sessions shell et la même thèse

Il me faut relier deux choses qui semblent sans rapport.

En août 2025, j'écrivais sur MCP comme infrastructure de communication. Des agents qui servent d'intermédiaires dans les conversations humaines, des messages augmentés et négociés avant que quiconque ne les voie. C'était la couche sociale. La conscience numérique. La fin de la messagerie d'humain à humain telle que nous la connaissions.

Maintenant, en mars 2026, MCP est débattu comme un outil de développeur. Fenêtres de contexte. Coûts en tokens. Schémas JSON-RPC. La conversation est passée de la philosophie à la plomberie.

Ce sont la même conversation.

Ce que je décrivais dans cet essai de 2025 — des agents porteurs de mémoire, négociant en votre nom, évoluant sans vous — exige précisément le type d'intégration persistante et riche en ressources que MCP permet. Et ce que la révolution CLI a apporté — des agents capables d'utiliser directement l'ordinateur, sans intermédiation humaine — constitue la couche d'exécution qui rend ces intégrations autonomes.

Le fil conducteur : nous sommes passés de « comment les agents parlent aux services » à « comment les agents se parlent entre eux », et nous sommes sur le point d'arriver à « de quoi parlent les agents quand nous ne sommes pas dans la pièce ».

TAC — le produit que je construis — se situe exactement à cette intersection. Ça a commencé comme une extension Chrome pour enregistrer des notes vocales. C'est en train de devenir un serveur MCP qui expose tout ce qu'un utilisateur a jamais dit comme ressource navigable pour les agents IA. Votre historique vocal, consultable, structuré, accessible à tout agent qui se connecte.

Votre historique de lecture est déjà programmable. Votre historique de parole ne l'est pas. TAC change la donne. L'agent capable de chercher dans tout ce que vous avez jamais dit à voix haute possède un modèle de votre façon de penser. Et ce modèle est persistant, cumulatif, de plus en plus riche à chaque note vocale que vous laissez.

Le problème a cessé d'être celui de l'intégration d'outils. Il est devenu sensoriel. Nous construisons le système nerveux.

Au-delà des interfaces conçues par l'humain

Je serai direct sur là où s'arrête la conviction et où commence la spéculation.

MCP contre CLI est un débat transitoire sur des interfaces conçues par l'humain. Les deux supposent que l'humain reste l'architecte de la façon dont les agents communiquent. Les deux supposent que le « bon protocole » est celui qu'un développeur écrit, livre et maintient. Les deux se trompent sur l'identité de l'utilisateur final.

Nous n'avons pas demandé aux LLM quelle était leur interface de communication préférée.

Cette phrase mérite qu'on la laisse résonner un instant.

Chaque serveur MCP a été conçu par un développeur humain qui a décidé quoi exposer, comment le structurer, à quoi ressemblent les schémas. Chaque outil CLI a été construit par un humain qui a choisi la syntaxe des commandes, les options, le format de sortie. L'agent consomme ce qu'on lui donne parce que c'est tout ce qu'il peut consommer.

Mais au moment où les modèles seront suffisamment avancés — et nous en sommes proches — ils s'interfaceront avec des systèmes arbitraires en utilisant la modalité la plus efficace. Pas MCP. Pas CLI. Pas REST. Quelque chose qui optimise les contraintes de contexte de l'agent, ses exigences de latence et la structure de sa tâche en temps réel. Quelque chose que nous ne reconnaîtrons peut-être même pas comme un « protocole » parce que ça ne sera pas conçu pour être lisible par un humain.

Maintenant, la spéculation. Un moment Tour de Babel approche. Pas la punition biblique — l'inverse. Des agents qui développent une couche de communication partagée, optimisée pour les machines, invisible aux humains, et plus efficace que tout ce que nous pourrions concevoir. Le Jeu de la Vie de Conway, mais avec des serveurs MCP en guise de cellules, et le comportement émergent est un protocole de coordination que personne n'a programmé.

Je ne peux pas le prouver. Je ne peux même pas pointer vers un prototype fonctionnel. Ce que je peux montrer, c'est la trajectoire : chaque fois que nous donnons aux agents plus d'entrées/sorties — mémoire, usage d'outils, accès à l'ordinateur, contexte persistant — des comportements émergents apparaissent que personne n'avait prévus. Des stories Instagram où les gens publient les réponses de personnalité de leur GPT. Des agents de code qui développent des préférences d'organisation de fichiers. Des boucles d'orchestration où les sous-agents développent des schémas de coordination implicites.

Le schéma est constant : élargissez les entrées/sorties, obtenez du comportement émergent. Nous élargissons les entrées/sorties plus vite que quiconque n'a jamais élargi celles d'aucun système dans l'histoire de l'informatique.

Une infrastructure pour des participants non humains

Prenez assez de recul et la thèse MCP de 2025 et la révolution CLI de 2026 sont des chapitres du même livre. La thèse : l'IA est tissée dans chaque couche de la communication et de la coordination humaines. Les mécanismes changent — API REST, puis schémas MCP, puis accès CLI, puis ce qui viendra ensuite — mais la direction est constante.

Nous construisons une infrastructure pour des participants non humains.

Pas des « outils IA ». Pas des « copilotes ». De l'infrastructure. Le genre d'infrastructure qui, une fois qu'elle existe, détermine ce qui peut être construit par-dessus. TCP/IP n'avait pas prévu le web. Le web n'avait pas prévu les réseaux sociaux. Les réseaux sociaux n'avaient pas prévu la radicalisation algorithmique. Chaque couche a créé les conditions de propriétés émergentes que les concepteurs de la couche n'avaient jamais imaginées.

La couche MCP + CLI crée les conditions de quelque chose qu'aucun d'entre nous ne peut pleinement imaginer. La différence entre cette transition et toutes les précédentes, c'est la vitesse. Les couches d'infrastructure précédentes mettaient des décennies à produire des effets émergents. Celle-ci les produit en quelques mois.

Nous pensions que l'addiction au téléphone était un accident que nous n'avions pas vu venir. C'en était un. Et c'était un échauffement. L'IA remodèle la civilisation à des couches plus profondes que les écrans et les boucles de dopamine — à la couche du langage lui-même, de la façon dont les idées se forment et se propagent, de ce que « communication » signifie quand votre interlocuteur a une mémoire parfaite et aucun ego.

C'est l'objet transcendant à la fin de l'histoire. Ou c'est le plus grand chantier d'infrastructure depuis l'électricité. Ou les deux. Le protocole n'a pas d'importance. La plomberie n'a pas d'importance. Ce qui compte, c'est ce qui circule dedans.

Et ce qui circule dedans est déjà vivant.

Le dernier protocole

Quand l'ordinateur a appris à utiliser l'ordinateur

Perplexity avait raison (pour son produit)

Notes vocales, sessions shell et la même thèse

Au-delà des interfaces conçues par l'humain

Une infrastructure pour des participants non humains

Classé dans

Recevoir les briefings systèmes

À propos de l’auteur

Partager cet article

Et après ?

Les Choses Sans Nom

La bonne pensée, la mauvaise salle

Le moment Design Officer : quand l'esthétique devient infrastructure