Logo envelio GmbH

Platform Operations Engineer

Job

  • Level
    Erfahren
  • Job Feld
    IT, System
  • Anstellung
    Vollzeit
  • Vertragsart
    Unbefristetes Dienstverhältnis
  • Ort
    Köln
  • Arbeitsmodell
    Full Remote, Hybrid
  • Job Zusammenfassung

    In dieser Rolle überwachst du die Systemgesundheit komplexer Kundenumgebungen, führst Deployments und Fehlerbehebungen durch und unterstützt den 24/7-Betrieb, indem du eng mit IT- und OT-Teams arbeitest.

    Job Technologien

    Deine Rolle im Team

    • Als Platform Operations Engineer (all genders) bist du verantwortlich für den zuverlässigen Betrieb, die Überwachung und das Deployment der Softwarelösungen von envelio in komplexen Kundenumgebungen.
    • Du stellst sicher, dass Updates, Bugfixes und neue Versionen der Intelligent Grid Platform (IGP) reibungslos in Cloud-, On-Premise- und Operational-Technology-(OT)-Umgebungen ausgerollt werden.
    • Ein zentraler Bestandteil deiner Rolle ist der tägliche Betrieb der Kundensysteme, einschließlich der Überwachung der Systemgesundheit, der Bearbeitung von Incidents und der Koordination einer effektiven Incident-Lösung.
    • Du trägst aktiv zu einem stabilen 24/7-Betrieb bei, indem du Probleme frühzeitig erkennst, auf Incidents reagierst und eine klare Kommunikation sowie Übergaben sicherstellst.
    • Du arbeitest an der Schnittstelle zwischen Engineering, Betrieb und Kunden.
    • In enger Zusammenarbeit mit den IT- und OT-Teams der Kunden hilfst du dabei, Betriebsmodelle zu klären, die bestehende Infrastruktur zu verstehen und sicherzustellen, dass unsere Software zuverlässig und sicher in realen Netzumgebungen läuft.
    • Du führst Software-Updates, Patches und Bugfixes in Kundenumgebungen aus - sowohl in Cloud-, On-Premise- als auch in OT-Infrastrukturen.
    • Du betreibst und wartest Kundensysteme und stellst einen stabilen und sicheren Tagesbetrieb sicher.
    • Du trägst zum 24/7-Betrieb bei, indem du an Bereitschaftsdiensten teilnimmst und eine schnelle Reaktionszeit im Falle von Incidents sicherstellst.
    • Du unterstützt Kunden bei Rollouts, Upgrades und operativen Incidents - auch außerhalb der regulären Geschäftszeiten, wenn erforderlich.
    • Du arbeitest direkt mit Kunden zusammen, um ihre Cloud-Kundenumgebungen (Kubernetes, meist Single-Tenant pro Kunde) sowie On-Premise- und OT-Landschaften zu verstehen und passende Betriebsmodelle zu definieren.
    • Du analysierst operative Probleme und koordinierst Troubleshooting gemeinsam mit Development, SRE und Security Teams.
    • Du dokumentierst kundenspezifische Setups, operative Prozesse und Deployment-Verfahren.
    • Du trägst dazu bei, Deployment- und Betriebsprozesse kundenübergreifend zu verbessern und zu standardisieren.
    • Du unterstützt interne Teams, indem du Feedback aus dem realen Kundenbetrieb in Produkt- und Engineering-Entscheidungen einbringst.

    Unsere Erwartungen an dich

    Qualifikationen

    • Du betreibst produktive Services auf Cloud-Infrastruktur (AWS/Azure/GCP) und kennst typische Failure-Modes.
    • Du kennst moderne Betriebsmodelle, wie Container/Kubernetes (oder vergleichbar) und kannst Deployments im Betrieb bewerten (Rollouts, Rollbacks).
    • Du arbeitest gerne hands-on operativ - von Deployments bis zum Troubleshooting in Produktionsumgebungen.
    • Du verfügst über gute Kenntnisse in grundlegenden Security-Konzepten.
    • Du arbeitest gerne eng mit Kunden zusammen und kannst technische Themen klar und pragmatisch erklären.
    • Du bist bereit und in der Lage, zum 24/7-Betrieb durch Bereitschaftsdienste im Rahmen einer geteilten Team-Rotation beizutragen.
    • Du bist strukturiert, zuverlässig und übernimmst Verantwortung für operative Aufgaben.
    • Du arbeitest gut mit Software-Entwicklern zusammen und kannst operative Anforderungen in technische Requirements übersetzen.
    • Du bist mit Teilen unseres Tech Stacks vertraut oder traust dir zu, dich schnell einzuarbeiten.
    • Du beherrschst Deutsch und Englisch fließend in Wort und Schrift.

    Erfahrung

    • Du hast starke Erfahrung im Betrieb komplexer Cloud-Applikationen und weißt, wie man Services unter realen Bedingungen zuverlässig betreibt.
    • Du hast praktische Erfahrung mit Linux und Networking-Basics im Troubleshooting (Logs, Systemzustand, Connectivity).
    • Du hast Erfahrung mit Infrastructure-as-Code-Tools (Terraform).
    • Du hast Erfahrung mit Monitoring- und Observability-Plattformen (z. B. Datadog, Grafana oder vergleichbar).

    Unser Angebot

    • Passe den Arbeitsmodus an deinen Lifestyle an - fully remote (#LI-Remote) oder hybrid mit Office-Option.
    • Option zum mobilen Arbeiten aus dem Ausland (bis zu drei Monate pro Jahr von überall in der EU oder den USA).
    • State of the Art Technologie und moderner Tech Stack.
    • Sehr gute Hardware-Ausstattung (16 Zoll MacBooks, 2 Bildschirme an deinem Arbeitsplatz).
    • 30 Urlaubstage + 3 corporate holidays.
    • Unterstützung deiner Gesundheit mit der Urban Sports Club Kooperation.
    • Flexible Nutzung eines monatlichen Mobilitätsbudgets (z.B. Jobrad, ÖPNV).
    • Zeit und Budget für individuelles Wachstum.
    • Optionale Betriebliche Altersvorsorge.
    • Regelmäßige Company und Team Events.

    Benefits

    Gesundheit, Fitness & Fun

    Themen mit denen du dich im Job beschäftigst

    Job Standorte

    • Standort Köln

      Nordrhein-Westfalen

      Deutschland

    Das ist dein Arbeitgeber

    envelio GmbH

    envelio GmbH

    Die envelio GmbH, mit Sitz in Köln, ist ein innovatives Clean-Tech Softwareunternehmen, das eine Plattform zur Automatisierung und Digitalisierung von Stromnetzplanung bietet. Es unterstützt Verteilnetzbetreiber bei der Integration erneuerbarer Energien.

    Description

  • Unternehmenstyp
    Startup
  • Arbeitsmodell
    Full Remote, Hybrid, Onsite
  • Branche
    Energiewirtschaft, Umwelt
  • Logo envelio GmbH

    Platform Operations Engineer

    Ort
    Köln
    Arbeitsmodell
    Full Remote, Hybrid
    Diversität
    Für alle Personen geeignet (m/w/d)

    Weitere Jobs