Platform Operations Engineer bei envelio GmbH

Level: Erfahren

Job Feld: IT, System

Anstellung: Vollzeit

Vertragsart: Unbefristetes Dienstverhältnis

Ort: Köln

Arbeitsmodell: Full Remote, Hybrid

Job Zusammenfassung

In dieser Rolle überwachst du die Systemgesundheit komplexer Kundenumgebungen, führst Deployments und Fehlerbehebungen durch und unterstützt den 24/7-Betrieb, indem du eng mit IT- und OT-Teams arbeitest.

Job Technologien

Deine Rolle im Team

Als Platform Operations Engineer (all genders) bist du verantwortlich für den zuverlässigen Betrieb, die Überwachung und das Deployment der Softwarelösungen von envelio in komplexen Kundenumgebungen.
Du stellst sicher, dass Updates, Bugfixes und neue Versionen der Intelligent Grid Platform (IGP) reibungslos in Cloud-, On-Premise- und Operational-Technology-(OT)-Umgebungen ausgerollt werden.
Ein zentraler Bestandteil deiner Rolle ist der tägliche Betrieb der Kundensysteme, einschließlich der Überwachung der Systemgesundheit, der Bearbeitung von Incidents und der Koordination einer effektiven Incident-Lösung.
Du trägst aktiv zu einem stabilen 24/7-Betrieb bei, indem du Probleme frühzeitig erkennst, auf Incidents reagierst und eine klare Kommunikation sowie Übergaben sicherstellst.
Du arbeitest an der Schnittstelle zwischen Engineering, Betrieb und Kunden.
In enger Zusammenarbeit mit den IT- und OT-Teams der Kunden hilfst du dabei, Betriebsmodelle zu klären, die bestehende Infrastruktur zu verstehen und sicherzustellen, dass unsere Software zuverlässig und sicher in realen Netzumgebungen läuft.
Du führst Software-Updates, Patches und Bugfixes in Kundenumgebungen aus - sowohl in Cloud-, On-Premise- als auch in OT-Infrastrukturen.
Du betreibst und wartest Kundensysteme und stellst einen stabilen und sicheren Tagesbetrieb sicher.
Du trägst zum 24/7-Betrieb bei, indem du an Bereitschaftsdiensten teilnimmst und eine schnelle Reaktionszeit im Falle von Incidents sicherstellst.
Du unterstützt Kunden bei Rollouts, Upgrades und operativen Incidents - auch außerhalb der regulären Geschäftszeiten, wenn erforderlich.
Du arbeitest direkt mit Kunden zusammen, um ihre Cloud-Kundenumgebungen (Kubernetes, meist Single-Tenant pro Kunde) sowie On-Premise- und OT-Landschaften zu verstehen und passende Betriebsmodelle zu definieren.
Du analysierst operative Probleme und koordinierst Troubleshooting gemeinsam mit Development, SRE und Security Teams.
Du dokumentierst kundenspezifische Setups, operative Prozesse und Deployment-Verfahren.
Du trägst dazu bei, Deployment- und Betriebsprozesse kundenübergreifend zu verbessern und zu standardisieren.
Du unterstützt interne Teams, indem du Feedback aus dem realen Kundenbetrieb in Produkt- und Engineering-Entscheidungen einbringst.

Unsere Erwartungen an dich

Qualifikationen

Du betreibst produktive Services auf Cloud-Infrastruktur (AWS/Azure/GCP) und kennst typische Failure-Modes.
Du kennst moderne Betriebsmodelle, wie Container/Kubernetes (oder vergleichbar) und kannst Deployments im Betrieb bewerten (Rollouts, Rollbacks).
Du arbeitest gerne hands-on operativ - von Deployments bis zum Troubleshooting in Produktionsumgebungen.
Du verfügst über gute Kenntnisse in grundlegenden Security-Konzepten.
Du arbeitest gerne eng mit Kunden zusammen und kannst technische Themen klar und pragmatisch erklären.
Du bist bereit und in der Lage, zum 24/7-Betrieb durch Bereitschaftsdienste im Rahmen einer geteilten Team-Rotation beizutragen.
Du bist strukturiert, zuverlässig und übernimmst Verantwortung für operative Aufgaben.
Du arbeitest gut mit Software-Entwicklern zusammen und kannst operative Anforderungen in technische Requirements übersetzen.
Du bist mit Teilen unseres Tech Stacks vertraut oder traust dir zu, dich schnell einzuarbeiten.
Du beherrschst Deutsch und Englisch fließend in Wort und Schrift.

Erfahrung

Du hast starke Erfahrung im Betrieb komplexer Cloud-Applikationen und weißt, wie man Services unter realen Bedingungen zuverlässig betreibt.
Du hast praktische Erfahrung mit Linux und Networking-Basics im Troubleshooting (Logs, Systemzustand, Connectivity).
Du hast Erfahrung mit Infrastructure-as-Code-Tools (Terraform).
Du hast Erfahrung mit Monitoring- und Observability-Plattformen (z. B. Datadog, Grafana oder vergleichbar).

Unser Angebot

Passe den Arbeitsmodus an deinen Lifestyle an - fully remote (#LI-Remote) oder hybrid mit Office-Option.
Option zum mobilen Arbeiten aus dem Ausland (bis zu drei Monate pro Jahr von überall in der EU oder den USA).
State of the Art Technologie und moderner Tech Stack.
Sehr gute Hardware-Ausstattung (16 Zoll MacBooks, 2 Bildschirme an deinem Arbeitsplatz).
30 Urlaubstage + 3 corporate holidays.
Unterstützung deiner Gesundheit mit der Urban Sports Club Kooperation.
Flexible Nutzung eines monatlichen Mobilitätsbudgets (z.B. Jobrad, ÖPNV).
Zeit und Budget für individuelles Wachstum.
Optionale Betriebliche Altersvorsorge.
Regelmäßige Company und Team Events.

Benefits

Gesundheit, Fitness & Fun

Themen mit denen du dich im Job beschäftigst

Job Standorte

Standort Köln
Nordrhein-Westfalen
Deutschland
Standort Köln
Nordrhein-Westfalen
Deutschland

Das ist dein Arbeitgeber

envelio GmbH

Die envelio GmbH, mit Sitz in Köln, ist ein innovatives Clean-Tech Softwareunternehmen, das eine Plattform zur Automatisierung und Digitalisierung von Stromnetzplanung bietet. Es unterstützt Verteilnetzbetreiber bei der Integration erneuerbarer Energien.

Unternehmenstyp: Startup

Arbeitsmodell: Full Remote, Hybrid, Onsite

Branche: Energiewirtschaft, Umwelt

Platform Operations Engineer

envelio GmbH

Ort: Köln
Arbeitsmodell: Full Remote, Hybrid
Diversität: Für alle Personen geeignet (m/w/d)