Skip to Content

Was ist ein Site Reliability Engineer?

Ein Site Reliability Engineer (SRE) kann dazu beitragen, DevOps-Erfolg zu ermöglichen, einen besseren Einblick in den Zustand geschäftskritischer Services zu erhalten, die Reaktionszeiten für Vorfälle zu verbessern und eine hohe Verfügbarkeit aller Anwendungen sicherzustellen. In diesem Artikel erfahren Sie, was ein SRE ist und wie er Ihrem Unternehmen helfen kann, die Gesamtqualität und Zuverlässigkeit Ihres Software Development Lifecycle (SDLC) zu verbessern. 

Was ist ein Site Reliability Engineer?

Ein Site Reliability Engineer ist für die Überwachung, Automatisierung und Zuverlässigkeit des IT-Betriebs verantwortlich. Sie verwenden Softwareentwicklungstools, um IT-Betriebsaufgaben wie Änderungsmanagement, Vorfallreaktion und Produktionssystemmanagement zu automatisieren. Sie sind auch dafür verantwortlich, den Zustand von Softwareimplementierungen zu überwachen und Protokolle und Daten an die Entwickler weiterzuleiten. 

Warum SRE? 

Die Abkürzung SRE kann sich auf einen Site Reliability Engineer oder die Praxis des Site Reliability Engineering beziehen. Der Zweck der SRE-Praxis besteht darin, sicherzustellen, dass die Services und Anwendungen eines Unternehmens immer verfügbar sind – selbst durch häufige Updates, die vom Entwicklungsteam durchgeführt werden. 

Die SRE-Rolle hängt stark von Softwaretools und Automatisierung ab, die alltägliche Aufgaben wie Anwendungsüberwachung oder Systemmanagement vereinfachen können. Wenn Entwickler eine Anwendung aktualisieren, können ihre Änderungen manchmal die Anwendung beeinträchtigen und ihre Performance verringern oder sogar zum Absturz führen. SREs sind da, um auf diese potenziellen Probleme zu achten und sicherzustellen, dass Fehler im Softwarecode oder in der Implementierung die Fähigkeit des Unternehmens, seine Kunden zufriedenstellend zu bedienen, nicht beeinträchtigen. 

Ein großer Teil der Verantwortlichkeiten eines SRE besteht darin, als Puffer und Vermittler zwischen der IT-Entwicklung und dem Betrieb zu fungieren. Entwickler möchten ihre Software schnell und oft aktualisieren, aber Betriebsteams möchten etwas langsamer vorgehen, um sicherzustellen, dass die Updates keine Probleme verursachen. 

Aufgrund dieser Notwendigkeit, das beste Gleichgewicht zwischen Entwicklung und Betrieb aufrechtzuerhalten, müssen SREs mehrere Aufgaben – einschließlich Software-Engineering, Betrieb und Infrastrukturmanagement – in einem vereinen. Sie sind in der Regel auch sehr gut in der Lage, Netzwerke und Systeme im Allgemeinen zu erstellen und zu verwalten, und sie wissen, wie sie kostspielige Ausfallzeiten und Systemausfälle vorhersagen und verhindern können. 

Was machen die Site Reliability Engineers am Standort?

SREs arbeiten daran, die Verfügbarkeit, Performance und Zuverlässigkeit der IT-Infrastruktur eines Unternehmens aufrechtzuerhalten. Dazu gehören das Design, die Implementierung und die Gesamtüberwachung von Systemen, damit sie mit maximaler Effizienz am Laufen bleiben und immer die Art von intuitiven, reaktionsschnellen Erfahrungen bieten können, die Endbenutzer wünschen.  

Mithilfe von Softwaretools können SREs viele wichtige operative Aufgaben automatisieren und optimieren, z. B. Protokollanalysen, Patching und Aktualisierung von Anwendungen und Systemen, Testen von Produktionsumgebungen usw. Sie verwalten auch alle Systeme genau, erkennen und lösen alle auftretenden Probleme und führen Post-Mortems nach einem Vorfall durch, um zu analysieren, was passiert ist und wie es in Zukunft verhindert werden kann.  

Weitere Verantwortlichkeiten sind: 

  • Beratung mit Entwicklern, um sicherzustellen, dass die Zuverlässigkeit in jede Anwendung integriert ist
  • Arbeiten Sie mit dem Betrieb zusammen, um zu sehen, dass neue und aktualisierte Anwendungen ausreichend von der bestehenden IT-Infrastruktur unterstützt werden
  • Prognose und Planung für Kapazitätsbedarf sowie System-Performance und -Resilienz
  • Festlegen wichtiger Kennzahlen als Service-Level-Indikatoren (SLIs) und Service-Level-Ziele (SLOs) zur Messung von Fortschritt und Erfolg im Laufe der Zeit
  • Verbesserung des Lebenszyklus der Softwareentwicklung, insbesondere nach Vorfällen
  • Unterstützung von Entwicklungsteams durch Skalierung des Systems, Implementierung von Automatisierung und Schaffung neuer Funktionen
  • Reaktion auf und Lösung von Problemen bei der Support-Eskalation

Ist SRE das Gleiche wie DevOps ?

SRE ist nicht dasselbe wie DevOps, aber es gibt einige Ähnlichkeiten bei den Zielen jedes Teams. Sowohl SREs als auch DevOps möchten, dass Entwicklung und Betrieb enger und effektiver zusammenarbeiten. Sowohl SREs als auch DevOps setzen sich stark für Automatisierung und Systemoptimierung ein. 

Während herkömmliche DevOps-Praktiken zu einer besseren allgemeinen Zusammenarbeit und schnelleren Softwareentwicklungszyklen geführt haben, hatte DevOps in der Regel niemanden in seinem Team, der speziell für die Entwicklung verantwortlich ist, die die Performance und Zuverlässigkeit des Standorts verbessert oder erhöht. Hier glänzt der SRE. Der einzige Zweck eines SRE besteht darin, Zuverlässigkeit und Skalierbarkeit im gesamten System zu liefern (oder aufrechtzuerhalten). 

Wo DevOps sich auf Geschwindigkeit und Agilität konzentriert, konzentrieren sich SREs auf die Verwaltung der Infrastruktur und deren Verfügbarkeit und Performance. DevOps ist eher ein kultureller Ansatz in einem Unternehmen, aber ein SRE setzt hochspezialisierte Fähigkeiten ein, um DevOps zu unterstützen und gleichzeitig einen Spitzenbetrieb zu gewährleisten. 

Selbst innerhalb der DevOps-Kultur dienen SREs als Brücke zwischen IT-Betrieb und -Entwicklung. Sie fungieren oft als Qualitätssicherung, aber es handelt sich um proaktive QA. SREs sind oft ein kritischer Faktor, der es DevOps ermöglicht, erfolgreich zu sein, indem sie dazu beitragen, das ideale Gleichgewicht zwischen Systemstabilität und Entwicklungsgeschwindigkeit zu definieren. 

Welche Fähigkeiten benötigt ein SRE?

Da SREs die Brücke zwischen IT-Betrieb und Entwicklern bilden, benötigen sie eine ganze Reihe von Fähigkeiten. Viele der heutigen SREs sind ehemalige Sysadmins, die wissen, wie sie codieren können, oder ehemalige Softwareentwickler mit Erfahrung auf der Betriebsseite. 

SREs müssen wissen, wie sie skalierbare, belastbare IT-Systeme entwickeln und erstellen können. Sie müssen eine Vielzahl von Cloud-Computing-Plattformen verstehen. Sie müssen auch wissen, wie Netzwerkprotokolle konfiguriert und Datenbanken verwaltet werden. Und was vielleicht am wichtigsten ist, sie benötigen hervorragende Problemlösungs- und Kommunikationsfähigkeiten. 

Weitere wertvolle Fähigkeiten können sein: 

  • Umfassendes Verständnis der IT-Infrastruktur, sowohl in der Cloud als auch lokal 
  • Expertise in Containertechnologie und Orchestrierung
  • Fähigkeit, strategische Beziehungen zu Partnern, Anbietern und Kollegen aus allen Geschäftsbereichen aufzubauen
  • Erfahrung mit Programmiersprachen, Tools zur Überwachung und Versionskontrolle, Datenbanken und Betriebssystemen
  • Verwaltung und Wartung der Website-Infrastruktur
  • Vertrautheit mit ständiger Integration / kontinuierlicher Entwicklung (CI/CD )
  • Erfahrung mit verteilten Computersystemen

Sind SREs gefragt?

Die Antwort auf diese Frage ist ein klingendes Ja! SREs sind gefragter denn je, und diese Dynamik zeigt keine Anzeichen einer Verlangsamung. Branchenanalysten bei Gartner haben geschätzt, dass bis 2027 75 % der Unternehmen SRE-Praktiken im gesamten Unternehmen nutzen werden, um den Betrieb zu optimieren. Dieser Prozentsatz ist ein großer Sprung von nur 10 % der Unternehmen, die 2022 SRE-Praktiken nutzten. 

Da Unternehmen ihre Anwendungen und Services zunehmend online stellen, erwarten Kunden weiterhin einen nahtlosen Zugriff auf Services ohne Ausfallzeiten oder Verzögerungen. SREs sind ein wichtiger Bestandteil bei der Erfüllung dieser Erwartungen – insbesondere in Branchen, in denen Ausfallzeiten schwerwiegende Auswirkungen haben können, wie Technologie, Gesundheitswesen und Finanzen. 

Große globale Unternehmen benötigen Ingenieure mit SRE-Kenntnissen, um die Zuverlässigkeit ihrer Services und Anwendungen sicherzustellen. Während die Rolle viele technische Anforderungen hat, ist der SRE-Karriereweg weit geöffnet und kann zu weiteren Management- und Führungsrollen führen.

12/2024
Pure Storage FlashArray//C20
Extending the Pure Storage platform to entry-level capacities, FlashArray//C20 brings enterprise class storage to edge deployments and smaller workloads.
Datenblatt
3 Seiten
KONTAKTIEREN SIE UNS
Fragen, Kommentare?

Haben Sie eine Frage oder einen Kommentar zu Produkten oder Zertifizierungen von Pure?  Wir helfen Ihnen gerne!

Termin für Demo vereinbaren

Vereinbaren Sie einen Termin für eine Live-Demo und sehen Sie selbst, wie Pure Ihnen helfen kann, Ihre Daten in überzeugende Ergebnisse zu verwandeln. 

Rufen Sie uns an: +49 89 26200662
Presse:
 pr@purestorage.com

 

Pure Storage Germany GmbH

Mies-van-der-Rohe-Straße 6

80807 München

Deutschland

info@purestorage.com

SCHLIESSEN
Ihr Browser wird nicht mehr unterstützt!

Ältere Browser stellen häufig ein Sicherheitsrisiko dar. Um die bestmögliche Erfahrung bei der Nutzung unserer Website zu ermöglichen, führen Sie bitte ein Update auf einen dieser aktuellen Browser durch.