Beschreibung
Bei uns arbeiten Menschen mit Energie. Menschen, die sich leidenschaftlich für die Bedürfnisse unserer Kundinnen und Kunden einsetzen. Gemeinsam gewährleisten wir die sichere Versorgung der rheinischen Region mit Energie und Trinkwasser. Hierbei denken wir schon heute an morgen. Denn als zukunftsorientiertes Unternehmen gestalten wir die Energiewende auf allen Ebenen mit.
Als Arbeitgeber bieten wir abwechslungsreiche und verantwortungsvolle Tätigkeiten, eine leistungsorientierte Vergütung und h...
weiter lesen
Bei uns arbeiten Menschen mit Energie. Menschen, die sich leidenschaftlich für die Bedürfnisse unserer Kundinnen und Kunden einsetzen. Gemeinsam gewährleisten wir die sichere Versorgung der rheinischen Region mit Energie und Trinkwasser. Hierbei denken wir schon heute an morgen. Denn als zukunftsorientiertes Unternehmen gestalten wir die Energiewende auf allen Ebenen mit.
Als Arbeitgeber bieten wir abwechslungsreiche und verantwortungsvolle Tätigkeiten, eine leistungsorientierte Vergütung und hervorragende Sozialleistungen. Unsere Beschäftigten arbeiten in einem attraktiven beruflichen Umfeld mit individuellen Entwicklungsmöglichkeiten, einer modernen Unternehmenskultur und flexiblen, hybriden Arbeitszeitmodellen mit Home-Office.
Innerhalb unseres Bereiches Informationstechnologie besetzen wir am Standort Köln ab sofort die Stelle als Site Reliability Engineer (m/w/d) – E2E Observability & Dev(Sec)Ops Enablement.
**Warum diese Position wichtig ist**
Unsere IT-Services sind das Rückgrat für eine sichere Versorgung und die digitale Energiewende. Als Lead DevOps Engineer operationalisierst Du eine Ende‑zu‑Ende‑Sicht (E2E) über unsere IT-Services auf, etablierst Observability als Standard und verzahnst Entwicklung und Betrieb, damit wir Störungen proaktiv erkennen, MTTR senken und unsere Kundinnen und Kunden verlässlich versorgen.
## Deine Aufgaben
- Du verantwortest die E2E‑Sichtbarkeit unserer Technical-Services (Observability/Monitoring/Alerting) und setzt Standards für Telemetrie, Dashboards und Runbooks.
- Du etablierst den DevOps‑Lebenszyklus: von Product‑Backlog bis Betrieb inkl. Deployment‑Automatisierung, Release‑ und Incident‑Prozessen.
- Du führst ein SLO/SLI‑basiertes Betriebsmodell ein und steuerst es über Error Budgets.
- Du moderierst und standardisierst blameless Post‑Mortems und leitest nachhaltige Verbesserungen mit unserem E2E Management ab (Problem‑Management, RCA).
- Du entwickelst und verankerst Working Agreements für die cross-funktionale Zusammenarbeit zwischen Dev, Ops, Security, Netzwerk und DB-Teams.
- Du integrierst Security & Compliance in Pipelines und Betrieb (z. B. Scanner, Policies, Audits) und verbindest ITIL/ITSM mit DevOps‑Prinzipien.
- Du konsolidierst Tooling (Monitoring/Logging/Tracing/CI/CD) zu einer harmonisierten Plattform, inkl. Migrations‑ und Adaptionsplan.
- Du coachst Teams (Enablement, Trainings, Gilden/Communities of Practice) und treibst Kultur- und Prozessveränderungen.
## Das bringst du mit
**Must-haves**
- Mehrjährige Erfahrung (≈ 6–10 Jahre) in DevOps/SRE mit Verantwortung für Observability, Betriebsprozesse und Automatisierung.
- Nachweisbare Einführung von SLO/SLI und Error Budgets, Alerting‑Konzepten und Telemetrie‑Standards in hybriden Umgebungen. Erfahrung in der Moderation und Durchführung von blameless Post‑Mortems.
- Tiefes Verständnis für CI/CD, IaC und Cloud‑/On‑Prem‑Infrastruktur (Netzwerk, Security, Plattformen, Datenbanken im Zusammenspiel).
- Stärke in Change‑/Stakeholder‑Management auf mehreren Führungsebenen; Moderation, Konfliktlösung, Entscheidungsfähigkeit.
**Nice-to-haves**
- Erfahrung in regulierten Umgebungen/Kritischer Infrastruktur.
- Praxis mit Kubernetes‑Plattformbetrieb, Service Mesh, Policy‑as‑Code.
- Know‑how in Secrets‑/Identity‑Management.