Logo AtosIEviden

Werkstudent MLOps-Plattform & Cloud-Native Infrastruktur

Neu

Job

  • Level
    Junior
  • Job Feld
    IT, Software, DevOps
  • Anstellung
    Teilzeit
  • Vertragsart
    Praktikum / Schulpraktikum
  • Ort
    Hamburg, Berlin, Paderborn
  • Arbeitsmodell
    Hybrid, Onsite
  • Job Zusammenfassung

    In diesem Job arbeitest du an der Integration und Pflege einer Cloud-Native MLOps-Plattform, konfigurierst Kubernetes-Umgebungen und automatisierst Workflows mit Infrastructure-as-Code und CI/CD.

    Job Technologien

    Deine Rolle im Team

    • Als Werkstudent:in unterstützen Sie unser Team dabei, die verschiedenen Software-, Infrastruktur- und ML Komponenten unserer Forschungs- und Entwicklungsplattform zu einem funktionierenden Gesamtsystem zu verbinden und weiterzuentwickeln.
    • Die Plattform überwacht den Sicherheits- und Robustheitszustand von Machine-Learning-Systemen über ihren gesamten Lebenszyklus hinweg - als Cloud-Native-System auf Basis von Kubernetes, das wir aktuell auf eine OpenStack-basierte Cloud-Infrastruktur überführen.
    • Dabei arbeiten wir nach modernen Entwicklungs- und Betriebsprinzipien (Git-zentriert, IaC, Containerisierung, CI/CD).
    • Mitarbeit an unserer geschichteten IaC-Architektur mit OpenTofu/Terraform (modulare Layer für Cloud-Infrastruktur, Plattform-Dienste und Anwendungen).
    • Bereitstellung und Pflege von Kubernetes-Umgebungen, perspektivisch auf einer OpenStack-basierten Cloud, inkl. Netzwerk-, Storage- und Zugriffs-Konfiguration.
    • Deployment von Komponenten über Helm, Kustomize und K8s-Manifeste.
    • Fehlersuche im Cluster (Pods, Services, Logs, Events) mit kubectl.
    • Bau und Pflege von Docker-Images für unsere Services (Multi-Stage-Builds, Build-Automatisierung).
    • Verwaltung von Images in unserer internen Container-Registry.
    • Betrieb und Integration der MLOps-Bausteine: Kubeflow Pipelines & Training Operator, MLflow (Experiment-Tracking & Model Registry), KServe (Modell-Serving), MinIO (S3-kompatibler Storage).
    • Unterstützung beim Registrieren, Deployen und Versionieren von ML-Modellen sowie beim Aufsetzen von Trainings- und Serving-Pipelines.
    • Anbindung und Pflege der Streaming-Schicht für Inferenz-Logging (Kafka-kompatibler Message Broker, CloudEvents).
    • Implementierung und Konfiguration von Schnittstellen zwischen den Services (REST, GraphQL, Message-Queues, Modell-Inferenz-Protokolle).
    • Mitarbeit an unseren ML-Services in Python, z. B. bei Modell-Monitoring, Drift-Erkennung und der Demo-Anwendung.
    • Unterstützung bei Auswertungen, Diagnose-Plots und Methodenvergleichen.
    • Erstellen und Ausführen von Unit-, Integrations- und Smoke-/End-to-End-Tests.
    • Automatisierung wiederkehrender Deployment- und Build-Schritte; Mitwirken am Aufbau von CI/CD Pipelines.
    • Pflege von Architektur-, Deployment- und Runbook-Dokumentation (Markdown).
    • Aufbereitung von Demo-, Präsentations- und Reproduktionsmaterialien.

    Unsere Erwartungen an dich

    Qualifikationen

    • Eingeschriebene:r Student:in (Informatik, Data Science, Computational Engineering, Elektro-/Nachrichtentechnik oder vergleichbar).
    • Solide Python-Kenntnisse und Freude am Lesen und Verstehen fremden Codes.
    • Grundverständnis von Containern (Docker) und Kubernetes.
    • Sicherer Umgang mit Git und der Kommandozeile (Linux).
    • Selbstständige, lösungs- und prozessorientierte Arbeitsweise sowie Bereitschaft, sich zügig in neue Technologien einzuarbeiten.
    • Gute Deutsch- und Englischkenntnisse in Wort und Schrift.
    • Kenntnisse im MLOps-Umfeld (MLflow, Kubeflow, KServe, MinIO).
    • Interesse an ML-Sicherheit & -Robustheit (Angriffe auf Modelle, Modell-Monitoring).

    Erfahrung

    • Erfahrung mit Infrastructure-as-Code (Terraform/OpenTofu).
    • Erfahrung mit Cloud-Infrastruktur, idealerweise OpenStack.
    • Erfahrung mit Kafka bzw. event-getriebenen Architekturen.
    • Erfahrung mit ML-Frameworks (z. B. PyTorch) von Vorteil.
    • Erste Erfahrung mit agilen Methoden (Scrum, Kanban).

    Unser Angebot

    • Einsatzdauer: idealerweise 6-12 Monate.
    • Arbeitszeit: 15-20 Stunden pro Woche (in der vorlesungsfreien Zeit nach Absprache mehr).
    • Hybrides Arbeitsmodell mit Remote-Möglichkeit.

    Benefits

    Gesundheit, Fitness & Fun

    Work-Life-Integration

    Essen & Trinken

    Themen mit denen du dich im Job beschäftigst

    Job Standorte

    • Standort Paderborn

      Nordrhein-Westfalen

      Deutschland

    • Standort Berlin

      Deutschland

    • Standort Hamburg

      Deutschland

    Das ist dein Arbeitgeber

    AtosIEviden

    AtosIEviden

    Wien, Klagenfurt, Graz, Innsbruck, Neutal, Ternitz, Salzburg, München, Wien, Wien, Leonding, Leonding, Linz, Linz, Tübingen, Ingolstadt, Stuttgart, Pforzheim, Karlsruhe, Saarbrücken, Mannheim, Fürth, Frankfurt Am Main, Wiesbaden, Köln, Düsseldorf, Kassel, Leipzig, Essen, Paderborn, Holzminden, Hannover – Laatzen, Berlin, Berlin, Meppen, Bremen, Hamburg

    Zu den Geschäftsfeldern von Atos gehören Infrastructure & Data Management, Business & Platform Solutions, Big Data & Security, Unified Communication & Collaboration Transactional & Payment Services sowie Cloud & Enterprise Software.

    Description

  • Unternehmensgröße
    250+ Employees
  • Gründungsjahr
    2011
  • Sprachen
    Deutsch, Englisch
  • Unternehmenstyp
    Etablierte Firma
  • Arbeitsmodell
    Hybrid, Onsite
  • Branche
    Öffentlicher Dienst, Verbände, Industrie, Produktion, Internet, IT, Telekom
  • Dev Reviews

    by devworkplaces.com

    Gesamt

    (3 Bewertungen)
    4.0
    • Engineering

      3.7
    • Culture

      4.5
    • Career Growth

      3.8
    • Workingconditions

      4.0
    Alle Dev Reviews anzeigen
    Logo AtosIEviden

    Werkstudent MLOps-Plattform & Cloud-Native Infrastruktur

    Ort
    Hamburg, Berlin, Paderborn
    Arbeitsmodell
    Hybrid, Onsite
    Diversität
    Für alle Personen geeignet (m/w/d)

    Weitere Jobs