Apprendre
Créez des agents d’IA qui peuvent être mis à l’échelle : un cycle de vie pratique pour l’architecture d’agent des start-ups

Créez des agents d’IA qui peuvent être mis à l’échelle : un cycle de vie pratique pour l’architecture d’agent des start-ups

Comment a été ce contenu ?

La plupart des start-ups surdéveloppent leurs agents. Avant d’avoir 100 utilisateurs, elles passent directement à l’orchestration multi-agents, aux graphes de mémoire, aux environnements d’exécution et aux moteurs de politique. Les agents ne sont pas des plateformes à la base, mais des fonctionnalités du produit. Si vous envisagez le développement d’agents du point de vue du cycle de vie, en fonction de la croissance de la clientèle, l’architecture devient évidente. Et c’est généralement plus simple que le suggère le bruit de l’écosystème.

Voici un modèle de maturité pratique pour créer des agents sans développement précoce excessif.

Le cycle de vie des agents en un coup d’œil

Étape 0 : « Est-ce que quelqu’un l’utilise seulement ? »

0 à 10 clients | Pré-PMF

À ce stade, vous ne créez pas un système d’agents, vous créez un agent unique axé sur un seul résultat. Il ne repose généralement que sur quelques outils et s’exécute sans état. À son cœur, il s’agit d’une boucle de raisonnement avec des appels d’outils.

Architecture

Utilisateur→ Passerelle API → Calcul (AWS Lambda) → LLM (Amazon Bedrock) → Outil → Réponse

Aucune identité durable, aucune mémoire à long terme et aucun moteur d’orchestration.

Pile recommandée

Modèle

Amazon Bedrock

Utilisez les outils d’évaluation intégrés pour comparer les performances, les coûts et la précision entre les modèles, tout en ayant la possibilité de changer de modèle à mesure de votre évolution.

Exécution

AWS Lambda (par défaut)
Amazon Elastic Container Service (Amazon ECS)/AWS Fargate si la solution est basée sur des conteneurs

Stockage (si nécessaire)

Cadres

Appels de SDK bruts
SDK Light Strands Agents(un SDK d’agent open source pour les boucles de raisonnement et l’orchestration des outils) ou LangChain pour la gestion structurée des outils

Évitez ici les frameworks et environnements d’exécution multi-agents.

Objectif : valider que la boucle de raisonnement apporte une valeur réelle.

Étape 1 : « On commence à l’utiliser »

10 à 500 clients | Traction précoce

À mesure que l’utilisation réelle commence, de nouvelles exigences apparaissent. Les utilisateurs s’attendent à une continuité de session, les cas extrêmes apparaissent rapidement, les invites s’avèrent fragiles et le système doit gérer une utilisation simultanée. Vous avez probablement encore un agent principal, mais il a maintenant besoin d’une structure.

Alors, qu’est-ce qui doit changer ? Tout d’abord, vous devez introduire la mémoire de session, des sorties structurées et des abstractions d’outils plus claires. Les barrières de protection et l’observabilité de base deviennent également essentiels pour comprendre et stabiliser le système lors de l’utilisation réelle.

Pile recommandée

Exécution

AWS Lambda ou Amazon ECS
Amazon Elastic Kubernetes Service (Amazon EKS) uniquement si votre solution est déjà native Kubernetes

État

DynamoDB (persistance de session)
Amazon S3 (artefacts)
Base de données vectorielles, comme Amazon S3 Vectors, uniquement si la récupération est essentielle

Cadres

SDK Strands Agents(structure de raisonnement claire)
LangChain (composition d’outils)
LlamaIndex (cas d’utilisation nécessitant une récupération intensive)

Observabilité

Amazon CloudWatch (métriques et journaux)
AWS X-Ray (système de suivi distribué)
Amazon Managed Grafana (visualisation des données)

Évitez tout de même de trop en faire. La plupart des produits proposés ici bénéficient d’une boucle de raisonnement disciplinée.

Objectif : fiabilité sous une charge utilisateur réelle.

Étape 2 : « C’est un système maintenant »

500 à 5 000 clients | Complexité croissante

À la deuxième étape, le système commence à se comporter comme une véritable infrastructure. Vous avez des sessions simultanées, des flux de travail de longue durée et une exécution asynchrone. Les produits peuvent désormais être critiques pour l’entreprise, les coûts deviennent plus sensibles et les entreprises clientes commencent à poser des questions sérieuses. C’est le premier véritable point d’inflexion.

Pour fonctionner efficacement à ce stade, vous avez besoin de flux de travail durables, d’un isolement clair des locataires et des sessions, d’invites et d’outils avec gestion des versions, ainsi que de pipelines d’évaluation pour tester et améliorer en permanence le système.

Isolement : ce dont vous avez réellement besoin

À ce stade, l’isolement n’est plus facultatif. Mais ce dernier comporte plusieurs couches :

1. Isolement des données (obligatoire)

Partitions DynamoDB à étendue de locataire
Espaces de noms vectoriels par locataire
Préfixes/compartiments Amazon S3 par locataire
AWS Identity and Access Management (IAM)- informations d’identification d’outil avec étendue
Chiffrement avec AWS Key Management Service (KMS)

Il s’agit du strict minimum.

2. Isolement de l’exécution (souvent requis)

Limites de simultanéité par locataire
Groupes de travailleurs séparés pour les locataires Premium
Limitation de débit et disjoncteurs
Possibilité de comptes AWS distincts pour les grands clients

Cela protège contre les voisins bruyants.

3. Isolement au niveau de l’exécution (parfois requis)

Environnements de test (sandbox) robustes
Application centralisée des politiques
Contrôles d’audit standardisés
Limites de location claires au niveau de la couche d’exécution

C’est là que les environnements d’exécution d’agent gérés entrent en jeu.

Parcours d’architecture par défaut

Pour la plupart des start-ups à l’étape 2 :

Flux de travail

AWS Step Functions
Amazon EventBridge
Temporal (si une orchestration externe est préférée)

Exécution

Amazon EKS devient courant ici
Amazon ECS pour les modèles plus simples

Cadres

SDK Strands Agents pour un raisonnement structuré
LangGraph pour un flux de contrôle explicite
CrewAI uniquement si une véritable spécialisation multi-agents est nécessaire

Les primitives de flux de travail sont flexibles. Elles vous permettent d’itérer rapidement sur la logique du produit tout en vous garantissant une exécution durable et des nouvelles tentatives.

Quand adopter AgentCore à l’étape 2

Amazon Bedrock AgentCore est une plateforme agentique permettant de créer et d’exploiter des agents d’IA rapidement, en toute sécurité et à grande échelle. Elle fournit des services d’exécution, comme l’accès sécurisé aux outils, la mémoire, l’application des politiques et la surveillance opérationnelle, afin que votre équipe puisse se concentrer sur les performances des agents sans avoir à créer sa propre couche d’infrastructure.

Passez à AgentCore plus tôt si au moins 2 de ces conditions sont remplies :

Les accords avec les grandes entreprises reposent sur des garanties d’isolement
Les examens de sécurité exigent des modèles d’audit et de location formels
Vous façonnez l’application des politiques et de l’isolement sur mesure
Plusieurs agents/produits nécessitent une couche d’exécution partagée
Une simultanéité élevée nécessite des contrôles d’exécution standardisés

Règle générale :

Utilisez des primitives de flux de travail lors de la conception du produit
Utilisez AgentCore lorsque vous normalisez vos opérations

Objectif : infrastructure fiable avec isolement approprié.

Étape 3 : « Vous exploitez une plateforme d’agents »

Plus de 5 000 clients | Exposition aux grandes entreprises

À la troisième étape, vous ne créez plus simplement un agent ; vous gérez de nombreux agents appartenant à de nombreux locataires. Exigences de conformité, attribution des coûts et accord de niveau de service

Les attentes (SLA) font désormais partie du système. L’isolement au niveau de l’exécution est désormais un choix architectural rationnel.

Pile recommandée

Environnement d’exécution d’agent

Service d’exécution AgentCore
Ou plan de contrôle personnalisé sur Amazon EKS

Sécurité

Autorisations relatives aux outils avec une étendue AWS IAM
Limites strictes entre locataires
Segmentation du cloud privé virtuel (VPC)

Gouvernance

Attribution des coûts par locataire
Journalisation des audits
Application centralisée des politiques

Vous avez effectué la transition de la fonctionnalité à la plateforme.

AWS ou cadres : gardez des limites claires

Utilisez AWS pour ces éléments :

Exécution durable
Isolement
Identité
Observabilité
Gouvernance

Utilisez des frameworks (SDK Strands Agents, LangChain, LangGraph, CrewAI) pour :

Raisonnement structurant
Composition d’outils
Schémas de planification/d’exécution

Les problèmes d’infrastructure sont couverts par les primitives du cloud, tandis que les problèmes de raisonnement le sont par les cadres d’agent. Le mélange de ces couches crée souvent une complexité inutile.

Pour en savoir plus sur les outils AWS conçus pour créer des flux de travail basés sur l’IA et agentiques, regardez la présentation par Matt Garman d’Amazon Q Developer lors d’AWS re:Invent 2025. Amazon Q est une plateforme d’agents d’IA axée sur les développeurs qui vous aide à créer et déployer des applications uniques plus rapidement.

Le principe fondamental

Ne créez pas de plateforme d’agents. Créez un agent qui gagne le droit de devenir une plateforme. L’isolement, l’orchestration et la gouvernance doivent être dictés par la croissance de la clientèle, et non par les ambitions architecturales. Les agents sont des systèmes distribués contenant des boucles de raisonnement. Ajoutez de la complexité uniquement lorsque la réalité l’exige.

Si vous êtes une start-up en phase précoce qui souhaite innover grâce à l’IA agentique, AWS Activate peut vous aider à passer du prototype à la production. Notre programme phare pour les start-ups fournit des crédits AWS, des conseils techniques et une assistance en matière d’architecture, afin que vous puissiez vous concentrer sur la création d’agents qui apportent de la valeur et sur l’évolution de la plateforme à mesure de la croissance de votre entreprise. Rejoignez notre réseau de plus de 350 000 start-ups dans le monde entier et commencez à mettre à l’échelle avec des agents d’IA dès aujourd’hui.

Comment a été ce contenu ?