Job
- Level
- Erfahren
- Job Feld
- IT, DevOps
- Anstellung
- Vollzeit
- Vertragsart
- Unbefristetes Dienstverhältnis
- Ort
- Bonn
- Arbeitsmodell
- Hybrid, Onsite
Job Zusammenfassung
Du entwickelst und betreibst eine skalierbare, sichere Plattform in Kubernetes mit Fokus auf CI/CD, Observability und Multi-Cloud-Management, während du innovative Lösungen für AI-Modelle bereitstellst.
Job Technologien
Deine Rolle im Team
- Als "DevOps/Platform Engineer (m/w/d)" stellst du für unseren KI-Plattform Alan eine sichere, skalierbare, beobachtbare Plattform bereit und etablierst das Prinzip "You build it, you run it" im Team.
- Du unterstützt die produktiven Teams auf "paved paths" (Self-Service, Guardrails) und sorgst für vorhersehbare Performance und Kosten.
- Du übernimmst Ownership für zentrale Plattform-/Serving-Komponenten.
- Du betreibst K8s-Cluster, Networking (Ingress), Storage (Datenbanken, Snapshots) und OS/Kernel-Patching und stellst deren sicheren und stabilen Betrieb sicher.
- Du modellierst Multi-Cloud-Ressourcen (insb. Open Telekom Cloud) per Konsole und IaC (Terraform).
- Du baust CI/CD-Pipelines und Release-/Versionierungs-/Rollback-Strategien auf.
- Im Bereich Observability & Site Reliability Engineering implementierst du OpenTelemetry-basiertes Tracing, Metrics und Logs, definierst SLIs/SLOs, Alerting und Error Budgets.
- Gemeinsam mit unseren AI Engineers stellst du die Plattform für Model Serving bereit: GPU-Scheduling, Autoscaling, Inference-Gateways, Observability (Latency/QPS/Token-Kosten).
Unsere Erwartungen an dich
Ausbildung
- Du hast dein Masterstudium oder deine Promotion in einem der MINT-Fächer oder einem geisteswissenschaftlichen Fach mit MINT-Vertiefung erfolgreich abgeschlossen.
Qualifikationen
- Du hast Security-Fachwissen in Netzwerksicherheit, Secrets, Härtung (CIS), Software-Supply-Chain und Zugriffsprinzipien (Least Privilege).
- Dich zeichnen Neugier und Wissbegierde sowie eine ausgeprägte Problemlösungs- und Kommunikationsfähigkeit aus.
- Du kommunizierst überzeugend und effizient in deutscher und englischer Sprache.
Erfahrung
- Du verfügst über mindestens 2 Jahre relevante Berufserfahrung in den Bereichen DevOps, Site Reliability Engineering oder Platform Engineering und hast nachweisliche Verantwortung für Kubernetes, IaC, CI/CD, Observability sowie den produktiven Betrieb übernommen - idealerweise im SaaS-Umfeld.
- Du besitzt Praxis-Know-how in Git-basierten Deployments, modularer IaC, Secret-/Config-Management sowie Incident-Erfahrung.
- Idealerweise bringst du erste Praxiserfahrung im Betrieb von Inferenz-Workloads (vLLM o. ä.), GPU-Capacity-Management, Autoscaling und Observability, mit.
Unser Angebot
- Du arbeitest an einer hochmodernen, skalierbaren AI-Plattform mit viel Gestaltungsspielraum und übernimmst früh Verantwortung für zentrale Infrastruktur- und Architekturentscheidungen.
- Mit deinen zukünftigen Kolleg:innen tauschst du dich fachlich auf Augenhöhe aus und erhältst Budget und Zeit für eure eigenen Innovationsprojekte.
- Du wächst bei uns fachlich und persönlich durch speziell auf dich abgestimmte Weiterbildungen, Zertifizierungen und Laufbahnprogramme.
- In deinen Spezialgebieten kannst du deinen Schwerpunkt setzen und ausbauen.
- Neben einem attraktiven Fixgehalt zzgl. Umsatz- und Ergebnisbeteiligung kannst du Überstunden ausgleichen und Reisezeiten als Arbeitszeit buchen.
- Durch freie Wahl des Arbeitsorts und flexible Arbeitszeit gestaltest du deinen Arbeitsalltag passend zu deinem Lebensstil.
Benefits
Work-Life-Integration
Gesundheit, Fitness & Fun
Themen mit denen du dich im Job beschäftigst
Job Standorte
Das ist dein Arbeitgeber
comma soft
Die Comma Soft AG mit Sitz in Bonn hilft DAX-Konzernen, mittelständischen Unternehmen sowie Behörden die unzähligen Möglichkeiten der Digitalisierung zu nutzen. Als ganzheitlicher digitaler und neutraler Lösungspartner werden zusammen mit den Kunden bisher unerschlossene Ertragspotentiale aufgedeckt und so dauerhafter digitaler Erfolg durch neue Geschäftsmodelle, -prozesse und -strategien geschaffen.
Description
- Unternehmensgröße
- 50-249 Employees
- Gründungsjahr
- 1989
- Unternehmenstyp
- Digitale Agentur
- Arbeitsmodell
- Hybrid, Onsite
- Branche
- Internet, IT, Telekom