Logo SysEleven GmbH

Senior Site Reliability Engineer - Kubernetes Plattform

Job

  • Level
    Senior
  • Job Feld
    IT, DevOps
  • Anstellung
    Vollzeit
  • Vertragsart
    Unbefristetes Dienstverhältnis
  • Ort
    Berlin
  • Arbeitsmodell
    Full Remote, Onsite
  • Job Zusammenfassung

    In dieser Rolle entwickelst du innovative Observability-Lösungen für die MKA-Plattform, optimierst Kubernetes-Controller, automatisierst Produktionsanwendungen und führst CI/CD-Workflows mit GitOps durch.

    Job Technologien

    Deine Rolle im Team

    • Als Senior Site Reliability Engineer im MetaKube Accelerator Team nutzt du moderne Kubernetes- und Cloud-Native-Technologien, um die Zuverlässigkeit, Skalierbarkeit und operative Exzellenz der MKA-Plattform zu maximieren.
    • Du löst komplexe Plattform-Herausforderungen, entwickelst produktionsreife Systeme und trägst zu Shared Ownership und kontinuierlicher Verbesserung bei.
    • Entwerfen und Implementieren von Observability-Lösungen mit Prometheus, Loki und Mimir, einschließlich der Definition sinnvoller Alerts sowie der kontinuierlichen Verbesserung der Monitoring-Abdeckung.
    • Analyse, Troubleshooting und Weiterentwicklung eigener Kubernetes-Controller, um Zuverlässigkeit und Stabilität sicherzustellen.
    • Entwicklung und Wartung von Produktionsanwendungen mit Fokus auf Codequalität, Skalierbarkeit und operativer Einsatzfähigkeit.
    • Betrieb, Automatisierung und kontinuierliche Weiterentwicklung der MKA-Plattform mit Fokus auf Effizienz und Wartbarkeit.
    • Weiterentwicklung interner Tooling-Lösungen, um Automatisierung zu fördern und manuellen Aufwand zu reduzieren.

    Unsere Erwartungen an dich

    Qualifikationen

    • Gute Kenntnisse in Bash und/oder Python für Automatisierung und Tooling.
    • Verständnis von CI/CD-Pipelines, idealerweise mit Tekton-basierten Workflows.
    • Sehr gute Deutschkenntnisse sowie gute Englischkenntnisse (B2+) für die technische Zusammenarbeit.

    Erfahrung

    • Erfahrung im Betrieb von hochverfügbaren, geschäftskritischen Anwendungen in Cloud- und On-Premises-Umgebungen, inklusive Incident Leadership.
    • Sehr gute Kubernetes-Kenntnisse sowie Erfahrung im Cluster-Management.
    • Erfahrung mit GitOps-Prinzipien und ArgoCD für Deployment- und Delivery-Workflows.
    • Erfahrung mit Infrastructure as Code, insbesondere Terraform und Ansible.

    Unser Angebot

    • Du erhältst tiefgehende praktische Kubernetes-Erfahrung und lernst die Internals auf einem Level kennen, das nur wenige haben.
    • Du bekommst die Freiheit, Herausforderungen zu lösen, Wissen zu teilen und kontinuierlich zu lernen - sei es durch Team-Zusammenarbeit, interne Show-and-Tell-Sessions oder Konferenzen wie KubeCon oder Container Days.

    Benefits

    Work-Life-Integration

    Themen mit denen du dich im Job beschäftigst

    Job Standorte

    • Standort Berlin

      Deutschland

    Das ist dein Arbeitgeber

    SysEleven GmbH

    SysEleven GmbH

    Mit der SysEleven NEO-Methode sind wir von der Konzeptberatung, über Schulungen Ihrer Admins und DevOps bis hin zum Full Managed Betreib an Ihrer Seite. Dafür setzen wir uns intensiv mit Best-of-Breed-Technologien auseinander, damit Sie die freie Wahl haben, welche Technologie Sie einsetzen wollen.

    Description

  • Unternehmenstyp
    Etablierte Firma
  • Arbeitsmodell
    Full Remote, Hybrid, Onsite
  • Branche
    Internet, IT, Telekom
  • Logo SysEleven GmbH

    Senior Site Reliability Engineer - Kubernetes Plattform

    Ort
    Berlin
    Arbeitsmodell
    Full Remote, Onsite
    Diversität
    Für alle Personen geeignet (m/w/d)

    Weitere Jobs