Qu'est-ce que l'élasticité du cloud ?

L'élasticité du cloud est la capacité d'un système cloud à modifier automatiquement ses ressources de calcul pour s'adapter à une charge de travail variable. Également appelé "informatique élastique", ce concept est comparable à un élastique : il peut s'étirer pour gérer davantage de travail, puis revenir à sa taille initiale une fois le travail terminé. Vous n'avez donc pas besoin de deviner à l'avance la capacité dont vous aurez besoin. Au lieu de cela, votre service cloud vous fournit automatiquement plus de puissance de traitement, de mémoire ou d'espace de stockage lorsque vous enregistrez un pic de trafic, puis réduit ces ressources lorsque le trafic diminue. Cela peut aider les entreprises à économiser de l'argent en ne payant que les ressources qu'elles utilisent.

Comprendre l'informatique élastique

L'élasticité du cloud est un avantage clé du cloud computing qui permet à l'infrastructure cloud d'une entreprise d'augmenter ou de réduire automatiquement ses ressources en fonction de la demande. L'élasticité du cloud consiste à s'adapter aux changements imprévisibles de la charge de travail sans intervention humaine.

Par exemple, un site Web d'e-commerce peut enregistrer un pic de trafic énorme lors d'un événement comme le Black Friday. Grâce à l'informatique élastique, le site Web obtient automatiquement plus de serveurs pour gérer le pic de trafic, ce qui garantit une expérience d'achat fluide aux clients. Une fois les Fêtes terminées, le système réduit les ressources à des niveaux normaux.

Types d'élasticité du cloud

Un système peut utiliser l'élasticité de deux manières principales : horizontale et verticale.

Élasticité horizontale

On parle également de "scaling horizontal" ou de "scaling vertical". Il s'agit d'ajouter ou de supprimer des machines ou des instances dans votre système. Lorsque vous avez besoin de plus de capacité, vous ajoutez des serveurs. Quand vous n'en avez plus besoin, vous vous en débarrassez. Cette approche est souvent utilisée pour les applications qui peuvent être divisées et exécutées sur plusieurs serveurs à la fois.

Élasticité verticale

On parle également de "scaling à la hausse" ou de "scaling à la baisse". Cela implique d'augmenter ou de diminuer les ressources d'une seule machine. Par exemple, si vous avez besoin de plus de puissance pour un serveur spécifique, vous lui allouez plus de CPU, de mémoire ou d'espace de stockage. Une fois que vous avez terminé, vous pouvez réduire ces ressources.

Élasticité ou évolutivité du cloud

Bien que les termes "élasticité" et "évolutivité" soient souvent utilisés ensemble, ils décrivent des concepts différents.

L'évolutivité du cloud est la capacité d'un système à gérer une charge de travail plus importante au fil du temps en ajoutant des ressources. Il s'agit d'une stratégie de croissance planifiée à long terme. Par exemple, une entreprise peut savoir qu'elle aura plus d'utilisateurs chaque année. Elle prévoit donc d'ajouter des serveurs à son centre de données.
L'élasticité du cloud désigne la capacité d'un système à s'adapter en temps réel à des changements soudains et imprévisibles de la demande. Il s'agit d'un processus automatique et réactif qui vise à améliorer l'efficacité et à réduire les coûts.

Imaginez que vous vous préparez à courir un marathon en vous entraînant pendant des mois. L'élasticité, c'est comme un coureur qui peut instantanément accélérer ou ralentir son rythme pendant la course pour s'adapter aux autres coureurs.

Avantages de l'élasticité du cloud

L'informatique élastique offre de nombreux avantages potentiels aux entreprises et aux développeurs.

Rentabilité

L'informatique élastique peut vous aider à économiser de l'argent en ne payant que les ressources que vous utilisez. Lorsque la demande est faible, vous n'avez pas besoin de maintenir des serveurs supplémentaires en fonctionnement, ce qui réduit les dépenses inutiles. Vous pouvez également éviter d'acheter du matériel coûteux pour gérer les pics de trafic dont vous n'avez besoin que quelques fois par an.

Disponibilité et fiabilité élevées

En ajustant automatiquement les ressources, l'informatique élastique peut vous aider à vous assurer que votre application reste disponible et réactive, même en cas de pics de trafic inattendus. Cela peut éviter les ralentissements ou les plantages qui pourraient frustrer les utilisateurs ou nuire à la réputation de votre entreprise.

Performances améliorées

Le système ajoute automatiquement des ressources en cas de besoin, ce qui permet de maintenir des temps de réponse rapides et une expérience utilisateur fluide. C'est particulièrement important pour les applications dont les charges de travail sont imprévisibles, comme les jeux en ligne, les services de streaming ou l'e-commerce.

Gestion simplifiée

Comme le processus de scaling est automatisé, les développeurs et les équipes informatiques n'ont pas besoin de surveiller et d'ajuster manuellement les ressources. Cela permet de gagner du temps et de l'énergie, qui peuvent être consacrés à d'autres tâches importantes, comme le développement de nouvelles fonctionnalités ou l'amélioration de l'expérience utilisateur.

L'informatique élastique pour les développeurs professionnels

Pour les développeurs en entreprise, l'informatique élastique n'est pas qu'une fonctionnalité. C'est une stratégie importante qui peut aider à créer des applications résilientes, rentables et performantes. Il s'agit de concevoir des systèmes capables de s'adapter intelligemment à des charges de travail imprévisibles, en évitant à la fois le surprovisionnement et le sous-provisionnement. C'est particulièrement important pour les applications critiques qui doivent rester disponibles 24h/24, 7j/7, comme les plates-formes d'e-commerce, les services financiers ou les pipelines de traitement de données.

Créer des systèmes élastiques avec Compute Engine

L'élasticité du cloud est le principe de base du fonctionnement des groupes d'instances gérés (MIG) de Compute Engine. Au lieu de provisionner manuellement des VM pour gérer le trafic, vous pouvez concevoir un système qui s'adapte automatiquement aux variations de la demande. Un MIG est un groupe de VM identiques que vous pouvez gérer comme une seule entité. C'est l'outil principal pour créer un système élastique sur Compute Engine. Le MIG utilise un autoscaler pour ajouter ou supprimer automatiquement des VM du groupe en fonction de métriques prédéfinies, ce qui lui permet d'atteindre l'élasticité.

Voici comment un développeur professionnel peut appliquer ces concepts de manière pratique pour créer un système évolutif :

Créer un modèle d'instance de VM	Avant de pouvoir créer un système élastique, vous avez besoin d'un modèle d'instance. Ce modèle sert de source unique de vérité pour la configuration de la VM de votre application, y compris le type de machine, le disque de démarrage et tous les scripts de démarrage nécessaires. Cela garantit que chaque nouvelle VM est une réplique exacte de la précédente, ce qui favorise la cohérence et simplifie les déploiements.
Configurer le groupe d'instances géré	Accédez à la page "Groupes d'instances" de la console Google Cloud et créez un groupe d'instances géré. Sélectionnez le modèle d'instance que vous avez créé, définissez un nombre minimal et maximal d'instances, et choisissez les zones pour votre groupe afin d'assurer la redondance et la haute disponibilité.
Implémenter des règles d'autoscaling	C'est le cœur de l'élasticité du cloud. Au lieu d'un scaling simple basé sur le processeur, les développeurs d'entreprise peuvent implémenter des règles d'autoscaling avancées basées sur les métriques Cloud Monitoring (comme la longueur d'une file d'attente pour un service de traitement en backend) ou utiliser l'autoscaling prédictif, qui utilise les données historiques pour lancer de nouvelles VM avant qu'un pic de trafic ne soit attendu.
Ajouter un équilibreur de charge	Pour toute application accessible au public, un équilibreur de charge est essentiel pour répartir le trafic utilisateur entrant entre toutes les VM de votre groupe d'instances géré. Cela permet d'éviter qu'une seule VM ne soit surchargée et de garantir la haute disponibilité de votre application.

Créer un modèle d'instance de VM

Avant de pouvoir créer un système élastique, vous avez besoin d'un modèle d'instance. Ce modèle sert de source unique de vérité pour la configuration de la VM de votre application, y compris le type de machine, le disque de démarrage et tous les scripts de démarrage nécessaires. Cela garantit que chaque nouvelle VM est une réplique exacte de la précédente, ce qui favorise la cohérence et simplifie les déploiements.

Configurer le groupe d'instances géré

Accédez à la page "Groupes d'instances" de la console Google Cloud et créez un groupe d'instances géré. Sélectionnez le modèle d'instance que vous avez créé, définissez un nombre minimal et maximal d'instances, et choisissez les zones pour votre groupe afin d'assurer la redondance et la haute disponibilité.

Implémenter des règles d'autoscaling

C'est le cœur de l'élasticité du cloud. Au lieu d'un scaling simple basé sur le processeur, les développeurs d'entreprise peuvent implémenter des règles d'autoscaling avancées basées sur les métriques Cloud Monitoring (comme la longueur d'une file d'attente pour un service de traitement en backend) ou utiliser l'autoscaling prédictif, qui utilise les données historiques pour lancer de nouvelles VM avant qu'un pic de trafic ne soit attendu.

Ajouter un équilibreur de charge

Pour toute application accessible au public, un équilibreur de charge est essentiel pour répartir le trafic utilisateur entrant entre toutes les VM de votre groupe d'instances géré. Cela permet d'éviter qu'une seule VM ne soit surchargée et de garantir la haute disponibilité de votre application.

Relevez vos plus grands défis avec Google Cloud

Les nouveaux clients bénéficient de 300 $ de crédits à dépenser sur Google Cloud.

Quel problème essayez-vous de résoudre ?

What you'll get:

Guide par étapes

Architecture de référence

Solutions pré-intégrées disponibles

Ce service a été créé avec Vertex AI. Vous devez avoir au moins 18 ans pour l'utiliser. Ne saisissez pas d'informations sensibles, confidentielles ni personnelles.

Autres ressources

Autoscaling dans les groupes d'instances gérés : cette documentation fournit des informations détaillées sur l'utilisation de l'autoscaling avec les groupes d'instances gérés de Compute Engine.

Passez à l'étape suivante

Profitez de 300 $ de crédits gratuits et de plus de 20 produits Always Free pour commencer à créer des applications sur Google Cloud.

Vous avez besoin d'aide pour démarrer ?
Contacter le service commercial
Faites appel à un partenaire de confiance
Trouvez un partenaire
Poursuivez vos recherches
Voir tous les produits