这是indexloc提供的服务,不要输入任何密码

Was ist Cloud-Elastizität?

Cloud-Elastizität ist die Fähigkeit eines Cloud-Systems, Rechenressourcen automatisch an sich ändernde Arbeitslasten anzupassen. Dieses Konzept, auch als elastisches Computing bezeichnet, funktioniert wie ein Gummiband: Es kann sich dehnen, um mehr Arbeit zu bewältigen, und dann wieder zusammenziehen, wenn die Arbeit erledigt ist. Sie müssen also nicht im Voraus schätzen, wie viel Kapazität Sie benötigen. Stattdessen stellt Ihnen Ihr Cloud-Dienst automatisch mehr Rechenleistung, Arbeitsspeicher oder Speicherplatz zur Verfügung, wenn Sie einen Traffic-Anstieg haben, und skaliert wieder herunter, wenn es ruhiger wird. So können Unternehmen Geld sparen, da sie nur für die Ressourcen zahlen, die sie auch nutzen.

Elastisches Computing verstehen

Die Elastizität der Cloud ist ein wichtiger Vorteil des Cloud Computing. Sie ermöglicht es Unternehmen, die Ressourcen ihrer Cloud-Infrastruktur automatisch dem Bedarf anzupassen. Die grundlegende Cloud-Elastizität ermöglicht die Anpassung an unvorhersehbare Änderungen der Arbeitslast ohne jeden Eingriff durch Menschen.

So kann es beispielsweise an einem Feiertag wie dem Black Friday zu einem enormen Anstieg des Traffics auf einer E-Commerce-Website kommen. Mit elastischem Computing erhält die Website automatisch mehr Server, um den Traffic-Anstieg zu bewältigen, sodass Kunden ein reibungsloses Einkaufserlebnis haben. Nach dem Feiertag werden die Ressourcen wieder auf das normale Niveau reduziert.

Arten der Cloud-Elastizität

Es gibt zwei grundlegende Arten, auf die Systeme die Elastizität nutzen können: horizontal und vertikal.

Dies wird auch als „horizontale Skalierung“ bezeichnet. Dabei werden Ihrem System weitere Maschinen oder Instanzen hinzugefügt oder aus diesem entfernt. Wenn Sie mehr Kapazität benötigen, fügen Sie einfach weitere Server hinzu. Wenn Sie weniger brauchen, entfernen Sie sie. Dies wird häufig für Anwendungen verwendet, die aufgeteilt und gleichzeitig auf mehreren Servern ausgeführt werden können.

Dies wird auch als „Hochskalieren“ oder „Herunterskalieren“ bezeichnet. Dabei werden die Ressourcen einer einzelnen Maschine erhöht oder verringert. Wenn Sie beispielsweise mehr Leistung für einen bestimmten Server benötigen, können Sie ihm mehr CPU, Arbeitsspeicher oder Speicher zuweisen. Wenn Sie fertig sind, können Sie diese Ressourcen wieder reduzieren.

Cloud: Elastizität und Skalierbarkeit

Die Begriffe Elastizität und Skalierbarkeit werden oft zusammen verwendet, beschreiben aber unterschiedliche Dinge.

  • Cloud-Skalierbarkeit ist die Fähigkeit eines Systems, im Laufe der Zeit größere Arbeitslasten zu bewältigen, indem mehr Ressourcen hinzugefügt werden. Es ist eine geplante, langfristige Wachstumsstrategie. Ein Unternehmen weiß beispielsweise, dass es jedes Jahr mehr Nutzer haben wird, und plant daher, seinem Rechenzentrum weitere Server hinzuzufügen.
  • Cloud-Elastizität bedeutet, dass ein System in der Lage ist, sich in Echtzeit an plötzliche, unvorhersehbare Änderungen der Nachfrage anzupassen. Es ist ein automatischer und reaktiver Prozess, bei dem Effizienz und Kosteneinsparungen im Vordergrund stehen.

Stellen Sie sich das so vor: Skalierbarkeit ist wie die Vorbereitung auf einen großen Marathon, für den Sie monatelang trainieren. Elastizität ist dagegen ein Läufer, der während des Rennens sein Tempo beschleunigt oder verlangsamt, um sich an die anderen Läufer anzupassen.

Vorteile der Cloud-Elastizität

Elastisches Computing bietet Unternehmen und Entwicklern viele potenzielle Vorteile.

Kosteneffizienz

Elastisches Computing kann Ihnen helfen, Geld zu sparen, da Sie nur für die Ressourcen zahlen, die Sie nutzen. Bei geringer Nachfrage müssen Sie keine zusätzlichen Server betreiben, was unnötige Ausgaben reduziert. Außerdem müssen Sie keine teure Hardware kaufen, um Spitzenlasten zu bewältigen, die nur ein paar Mal im Jahr auftreten.

Hochverfügbarkeit und Zuverlässigkeit

Durch die automatische Anpassung der Ressourcen kann elastisches Computing dazu beitragen, dass Ihre Anwendung auch bei unerwarteten Traffic-Spitzen verfügbar und responsiv bleibt. So lassen sich Verlangsamungen oder Abstürze vermeiden, die Nutzer frustrieren und dem Ruf Ihres Unternehmens schaden könnten.

Verbesserte Leistung

Das System fügt bei Bedarf automatisch Ressourcen hinzu, was zu schnellen Reaktionszeiten und einer reibungslosen Nutzung beitragen kann. Das ist besonders wichtig für Anwendungen mit schwer vorhersehbaren Arbeitslasten, wie Online-Gaming, Streamingdienste oder E-Commerce.

Einfachere Verwaltung

Da der Skalierungsprozess automatisiert ist, müssen Entwickler- und IT-Teams Ressourcen nicht manuell überwachen und anpassen. So können Sie Zeit und Ressourcen einsparen, die Sie für andere wichtige Aufgaben wie die Entwicklung neuer Funktionen oder die Verbesserung der Nutzerfreundlichkeit einsetzen können.

Elastisches Computing für Unternehmensentwickler

Für Entwickler in Unternehmen ist elastisches Computing nicht nur eine Funktion, sondern eine wichtige Strategie, mit der sich robuste, kosteneffiziente und leistungsstarke Anwendungen entwickeln lassen. Es geht darum, Systeme zu entwickeln, die sich intelligent an unvorhersehbare Arbeitslasten anpassen können, um sowohl Über- als auch eine Unterbereitstellungen zu vermeiden. Das ist besonders wichtig für geschäftskritische Anwendungen, die rund um die Uhr verfügbar sein müssen, darunter E-Commerce-Plattformen, Finanzdienstleistungen oder Datenverarbeitungspipelines.

Elastische Systeme mit der Compute Engine erstellen

Die Cloud-Elastizität ist das Grundprinzip, nach dem verwaltete Compute Engine-Instanzgruppen (Managed Instance Groups, MIGs) funktionieren. Anstatt VMs manuell bereitzustellen, um Traffic zu verarbeiten, können Sie ein System entwerfen, das sich automatisch an Änderungen der Nachfrage anpasst. Eine MIG ist eine Gruppe identischer VMs, die Sie als eine Entität verwalten können. Sie ist das wichtigste Tool zum Aufbau eines elastischen Systems in der Compute Engine. Verwaltete Instanzgruppen verwenden Autoscaler, um VMs basierend auf vordefinierten Messwerten automatisch hinzuzufügen oder zu entfernen, um Elastizität zu bieten.

So können Entwickler in Unternehmen diese Konzepte praktisch anwenden, um skalierbare Systeme zu erstellen:

VM aus Instanzvorlage erstellen

Bevor Sie ein elastisches System erstellen können, benötigen Sie eine Instanzvorlage. Diese Vorlage dient als einzige Quelle der Wahrheit für die VM-Konfiguration Ihrer Anwendung, einschließlich des Maschinentyps, des Bootlaufwerks und aller erforderlichen Startscripts. So ist jede neue VM eine exakte Kopie der letzten, was die Konsistenz fördert und die Bereitstellung vereinfacht.

Verwaltete Instanzgruppe konfigurieren

Rufen Sie in der Google Cloud Console die Seite „Instanzgruppen“ auf und erstellen Sie eine neue verwaltete Instanzgruppe. Wählen Sie die erstellte Instanzvorlage aus, legen Sie die Mindest- und Höchstzahl der Instanzen fest und wählen Sie die Zonen für Ihre Gruppe aus, um Redundanz und Hochverfügbarkeit zu gewährleisten.

Autoscaling-Regeln implementieren

Dies ist das Herzstück der Cloud-Elastizität. Anstelle einer einfachen CPU-basierten Skalierung können Entwickler in Unternehmen erweiterte Autoscaling-Regeln basierend auf Cloud Monitoring-Messwerten (z. B. Warteschlangenlängen für Backend-Worker-Dienste) implementieren oder prädiktives Autoscaling verwenden, das anhand von Verlaufsdaten neue VMs vor einem erwarteten Traffic-Anstieg hochfährt.

Load Balancer hinzufügen

Für öffentlich zugängliche Anwendungen sind Load Balancer unerlässlich, um den eingehenden Nutzer-Traffic auf alle VMs in Ihrer verwalteten Instanzgruppe zu verteilen. Dies verhindert, dass eine einzelne VM überlastet wird, und Ihre Anwendung bleibt hochverfügbar.

VM aus Instanzvorlage erstellen

Bevor Sie ein elastisches System erstellen können, benötigen Sie eine Instanzvorlage. Diese Vorlage dient als einzige Quelle der Wahrheit für die VM-Konfiguration Ihrer Anwendung, einschließlich des Maschinentyps, des Bootlaufwerks und aller erforderlichen Startscripts. So ist jede neue VM eine exakte Kopie der letzten, was die Konsistenz fördert und die Bereitstellung vereinfacht.

Verwaltete Instanzgruppe konfigurieren

Rufen Sie in der Google Cloud Console die Seite „Instanzgruppen“ auf und erstellen Sie eine neue verwaltete Instanzgruppe. Wählen Sie die erstellte Instanzvorlage aus, legen Sie die Mindest- und Höchstzahl der Instanzen fest und wählen Sie die Zonen für Ihre Gruppe aus, um Redundanz und Hochverfügbarkeit zu gewährleisten.

Autoscaling-Regeln implementieren

Dies ist das Herzstück der Cloud-Elastizität. Anstelle einer einfachen CPU-basierten Skalierung können Entwickler in Unternehmen erweiterte Autoscaling-Regeln basierend auf Cloud Monitoring-Messwerten (z. B. Warteschlangenlängen für Backend-Worker-Dienste) implementieren oder prädiktives Autoscaling verwenden, das anhand von Verlaufsdaten neue VMs vor einem erwarteten Traffic-Anstieg hochfährt.

Load Balancer hinzufügen

Für öffentlich zugängliche Anwendungen sind Load Balancer unerlässlich, um den eingehenden Nutzer-Traffic auf alle VMs in Ihrer verwalteten Instanzgruppe zu verteilen. Dies verhindert, dass eine einzelne VM überlastet wird, und Ihre Anwendung bleibt hochverfügbar.

Meistern Sie Ihre geschäftlichen Herausforderungen mit Google Cloud

Neukunden erhalten ein Guthaben im Wert von 300 $ für Google Cloud.
Welches Problem möchten Sie lösen?
What you'll get:
Detaillierte Anleitung
Referenzarchitektur
Vorkonfigurierte Lösungen
Dieser Dienst wurde mit Vertex AI erstellt. Nutzer müssen mindestens 18 Jahre alt sein, um ihn verwenden zu können. Geben Sie keine vertraulichen oder personenbezogenen Daten ein.

Weitere Ressourcen

Gleich loslegen

Profitieren Sie von einem Guthaben über 300 $, um Google Cloud und mehr als 20 „Immer kostenlos“ Produkte kennenzulernen.

Google Cloud