Agent IA personnel : architecture, MCP et coûts réels -

Ce qu’il faut retenir

Un agent IA personnel est un assistant basé sur un LLM, raccordé à des outils externes via des connecteurs MCP, capable de gérer de façon autonome des tâches récurrentes comme la veille, l’agenda, la sécurité ou le coaching sportif, tout en mémorisant ses actions.
L’architecture repose sur trois couches distinctes : le prompt système (directives permanentes), la mémoire évolutive (historique et routines) et le profil utilisateur (préférences et informations personnelles), ce qui le différencie d’un simple chatbot à contexte limité.
La stack utilisée combine Claude Code, OpenAI Codex et Hermes Agent avec l’API DeepSeek, un choix économique qui permet de maintenir le coût par token bien inférieur à celui d’Anthropic ou d’OpenAI.
Les connecteurs MCP transforment l’agent en assistant opérationnel en lui offrant la possibilité d’interagir avec des services comme Google Agenda ou Matrix, et le protocole ouvert permet de créer des connecteurs sur mesure selon les besoins.
En pratique, l’agent couvre six usages concrets (veille mémorisante, second cerveau, digest d’agenda, coaching sportif, surveillance de sécurité WordPress et création de compétences) tout en respectant des garde‑fous : accès restreints, validation humaine et rôle d’information.

Résumé généré par IA

Un agent IA personnel est un assistant fondé sur un LLM, connecté à des outils externes via des connecteurs MCP (Model Context Protocol), capable de gérer des tâches récurrentes, veille, agenda, sécurité, coaching sportif, de façon autonome et mémorisante, sans intervention quotidienne.

Cet article documente l’architecture d’un agent IA personnel réellement utilisé dans mon quotidien : les outils, leur articulation, six usages concrets et les coûts mesurés sur plusieurs jours. L’objectif n’est pas de vendre une stack, mais de décrire ce qui fonctionne, et pourquoi, pour que tu puisses l’adapter à ton propre contexte.

La stack : Claude Code, OpenAI Codex et Hermes Agent
L’architecture en trois couches
Connecteurs MCP : ce qui transforme l’agent en assistant opérationnel
Six usages concrets de l’agent
Garde-fous et validation humaine
Combien coûte mon agent IA personnel ?

La stack : Claude Code, OpenAI Codex et Hermes Agent

La stack repose sur trois outils complémentaires aux rôles distincts : Claude Code (Anthropic) pour le développement et le raisonnement complexe, OpenAI Codex comme relais quand la limite de tokens de Claude est atteinte, et Hermes Agent couplé à l’API DeepSeek comme cœur de l’agent personnel.

Claude Code (abonnement Pro, Anthropic), outil principal : développement et tâches de raisonnement complexe.
OpenAI Codex, relais lorsque la limite de tokens de Claude est atteinte.
Hermes Agent (NousResearch) + API DeepSeek, le cœur de l’agent, économique et conçu pour tourner en continu 24h/24.

Le choix de DeepSeek est purement économique : son coût par token est nettement inférieur à celui d’Anthropic ou d’OpenAI. Rien n’oblige à ce fournisseur, les API d’Anthropic, d’OpenAI ou de Gemini peuvent remplir le même rôle selon ta priorité : coût, performance ou confidentialité.

L’architecture de l’agent IA personnel : trois couches

L’architecture de l’agent repose sur trois couches distinctes, le prompt système, la mémoire évolutive et le profil utilisateur, qui lui permettent de mémoriser, d’apprendre et de se personnaliser dans le temps. C’est précisément cette séparation qui distingue un agent mémorisant d’un simple chatbot à contexte limité.

Le prompt système : les directives permanentes. Ce que l’agent fait, ce qu’il ne fait pas, comment il interagit, son comportement de base, stable dans le temps.
La mémoire évolutive : tout ce qui change. Historique de veille, routines actives ou suspendues (les routines sportives peuvent être mises en pause pendant les vacances), sujets en cours de suivi. C’est la couche la plus déterminante : elle évite à l’agent de répéter les mêmes informations d’un jour à l’autre et lui permet de faire évoluer ses comportements sans reconfiguration manuelle.
Le profil utilisateur : ce que l’agent sait de toi. Langue, préférences, moments clés de la journée, informations à anticiper. C’est là que la personnalisation s’approfondit vraiment.

Pour échanger avec l’agent, ma messagerie repose sur une instance auto-hébergée du protocole Matrix, accessible via le client Element. Ce choix garantit le chiffrement de bout en bout (E2EE) et la maîtrise totale des données échangées : aucun tiers n’accède aux conversations (pas de Telegram, pas de WhatsApp)

Connecteurs MCP : ce qui transforme l’agent en assistant opérationnel

Les connecteurs MCP (Model Context Protocol) sont le mécanisme qui transforme un agent conversationnel en assistant opérationnel. Le protocole a été publié en open source par Anthropic le 25 novembre 2024 (Anthropic, 2024) ; il permet à l’agent d’interagir avec des outils et services externes : publier un article, lire un agenda, accéder à un dépôt GitHub, interroger un serveur de production.

Le catalogue (Hermes Agent) de connecteurs disponibles nativement reste limité, n8n, Linear et GitHub, mais le protocole est ouvert : on peut créer ses propres connecteurs. Pour cet agent, deux MCP personnalisés ont été mis en place, l’un pour Google Agenda, l’autre pour la messagerie Matrix.

C’est cette extensibilité qui distingue une architecture MCP d’un chatbot à plugins prédéfinis : tu construis l’écosystème exact dont tu as besoin, pas celui qu’un éditeur a anticipé à ta place.

Six usages concrets de l’agent IA personnel (ce que j’utilise)

1. Veille quotidienne mémorisante

Chaque jour à heure fixe, l’agent génère une synthèse de veille sur les sujets définis dans son profil.

Dès le deuxième jour, un problème est apparu : il répétait des informations déjà transmises.

La correction a été simple, lui demander de mémoriser ce qu’il a déjà communiqué et de varier ses sources. Depuis, la veille est non-répétitive et s’approfondit sur les sujets qui suscitent un intérêt explicite.

Un suivi de long terme peut être déclenché à tout moment : il suffit de demander à l’agent de suivre un sujet « jusqu’à résolution », et il l’intègre à la veille permanente sans intervention ultérieure.

2. Second cerveau automatisé

La gestion d’une base de connaissances personnelle est entièrement déléguée à l’agent : structuration des fichiers, classement des informations, nettoyage hebdomadaire.

Au bout de plusieurs jours d’usage continu, la base évolue de façon quasi autonome, alimentée par la veille quotidienne. C’est un second cerveau IA qui se construit sans effort de maintenance active.

3. Digest d’agenda et alertes proactives

Via le connecteur MCP Google Agenda, l’agent génère chaque matin un récapitulatif de la journée :

rendez-vous,
réunions,
alertes de chevauchement.

Sa fonction la plus utile est proactive : en début de semaine, il détecte les réunions dont il n’a aucune information contextuelle et en demande une description. Les informations fournies sont ensuite stockées dans sa mémoire et peuvent alimenter le second cerveau.

4. Coaching sportif par responsabilité

Chaque soir, l’agent demande un compte-rendu de l’activité physique du jour (de la callisthénie, dans mon cas). Pas de message motivant : une simple question factuelle, « Qu’est-ce que tu as fait aujourd’hui ? », et aucun message les jours où la séance a déjà été déclarée.

L’effet est concret : devoir rendre des comptes m’oblige à être constant. J’ai de ce fait cherché sur internet (oui oui la recherche manuelle existe encore) afin de comprendre ce mécanisme car jusqu’à maintenant je n’arrivais pas à être constant sur le sport et aujourd’hui j’y arrive.

Et oui, il existe des études et autres méta-analyse qui parle du sujet (ici ou là) : en résumé rapide : le simple suivi de sa progression augmente significativement les chances d’atteindre un objectif.

Dans mon cas, l’agent conserve un récapitulatif hebdomadaire de l’activité.

5. Surveillance de sécurité des sites WordPress

Un script d’audit développé avec Claude analyse quotidiennement mes sites WordPress clients :

tentatives d’intrusion,
intégrité des fichiers,
plugins obsolètes,
vulnérabilités connues.

L’agent exécute ce scan et hiérarchise les alertes selon leur gravité. Un plugin non mis à jour déclenche une information, ce même plugin associé à une faille de sécurité répertoriée (Patchstack) déclenche une alerte prioritaire.

Dans tous les cas, l’agent propose des actions mais n’exécute rien sans validation explicite. Il peut détecter un hack dans la base de données via le script, mais il ne la nettoiera pas : la base de données est trop sensible, je préfère être alerté et intervenir moi-même.

6. Création de compétences à la demande

L’agent peut développer de nouvelles compétences à partir d’un besoin décrit en langage naturel.

Exemple concret : j’ai eu besoin de récupérer tous les jours une information sur un site (derrière une page de login), il faut : automatiser la connexion quotidienne au site (authentification, récupération du cookie de session, extraction de données sur une page protégée). L’agent a testé différentes méthodes, atteint l’objectif, puis enregistré la compétence.

Résultat : la fois suivante, il la réutilise directement, sans repasser par la phase de recherche, l’exécution est plus rapide et consomme moins de tokens.

Garde-fous : ce que l’agent ne peut pas faire seul

Un agent utile reste un agent contraint : trois principes délimitent strictement ce que le mien peut faire, accès restreints aux sources, validation humaine pour toute action significative, et rôle d’information plutôt que d’exécution autonome.

Accès restreints aux sources (connecteurs) : l’agent n’accède qu’aux systèmes pour lesquels une connexion explicite a été établie, avec des droits limités (lecture, écriture, etc.) selon ce que le connecteur autorise.
Validation humaine pour toute action significative : l’agent propose, je valide. Aucune action sur un système tiers ne s’exécute sans confirmation.
Information et proposition, pas exécution autonome : la frontière entre « informer » et « agir » est maintenue de façon stricte.

Cette gouvernance devient d’autant plus importante que l’agent gagne en autonomie et en accès : plus il sait faire, plus les garde-fous doivent être explicites.

Combien coûte mon agent IA personnel ?

Mon agent IA personnel coûte environ 0,04 à 0,07 $ par jour en API (dans mon utilisation : veille, second cerveau, sport, agenda)

Sur 18 jours d’utilisation, 0,78 $ ont été consommés sur un crédit initial de 5 $ d’API DeepSeek, soit 0,043 $ par jour en moyenne.

On en a clairement pour son argent. Dans mon cas, sans rien toucher et en partant sur le max dépensé par jour : 5/0,07 = 71 jours d’utilisations avec la mise de départ.

Demain je veux faire plus, je sais que j’ai de la marge -> tout est une question d’équilibre et de ce que l’on souhaite faire. En partant sur 10$ par mois je sais que je serai confortable dans mon utilisation.

Pour les tâches de raisonnement complexe ou de développement, Claude Pro (20 $/mois) reste mon outil principal : les deux sont complémentaires dans cette façon de faire.

FAQ

Quels sont les risques liés à un agent qui accède à tes outils personnels ?

Le risque principal est l'exécution non souhaitée d'une action sur un système connecté. Il se gère en amont : accès restreints au strict nécessaire, validation humaine obligatoire pour toute action à effets réels, et absence de clés critiques dans le périmètre de l'agent. Un agent bien contraint est sûr ; un agent aux accès illimités est dangereux.

Le MCP est-il compatible avec tous les LLM ?

Oui : le MCP est un protocole ouvert, conçu pour être agnostique au modèle. Il est compatible avec les principaux fournisseurs (Anthropic, OpenAI, Google) ainsi qu'avec des modèles open source via Hermes, et avec des outils d'automatisation comme n8n.

Peut-on automatiser la veille technologique avec un agent IA ?

C'est l'un des usages les plus matures et les plus rentables. Un agent configuré pour la veille peut consulter des flux RSS, des API de presse ou des résultats de recherche, filtrer selon des critères définis, mémoriser ce qu'il a déjà transmis pour éviter les redondances, et approfondir automatiquement les sujets signalés comme prioritaires.

Un agent IA personnel, c’est une infrastructure, pas un outil

Un agent IA personnel bien construit n’est pas un chatbot amélioré : c’est une infrastructure d’automatisation cognitive qui grandit avec toi.

Les tâches déléguées ici,

veille,
agenda,
sécurité,
coaching,
création de compétences,

représentent autant de charges mentales supprimées durablement.

Le point de départ n’a pas besoin d’être ambitieux : un agent qui envoie un digest d’agenda chaque matin est déjà utile.

L’architecture s’étend ensuite au rythme de tes besoins réels, pas à celui des fonctionnalités qu’un éditeur décide de proposer.

Pour aller plus loin, voir comment optimiser ton utilisation claude code.

Agent IA personnel : architecture, MCP et coûts réels