Level: Erfahren

Job Feld: Data

Anstellung: Vollzeit

Vertragsart: Unbefristetes Dienstverhältnis

Ort: Köln

Arbeitsmodell: Onsite

Job Zusammenfassung

In dieser Position entwickelst du innovative AI- und Machine-Learning-Lösungen, insbesondere Generative Deep Learning Modelle, und implementierst datengetriebene Systeme mithilfe von Python-Tools in einer Cloud-Umgebung.

Job Technologien

Deine Rolle im Team

Aufbau von innovativer AI- und Machine-Learning-Lösungen.
Entwicklung von Generative Deep Learning Models: Erstellen, trainieren und fine-tuning neuraler Netzwerke mit Python-Tools Torch, Numpy, Pandas, PySpark, Jupyter, Transformers, Datasets, Tiktoken und Wandb.
Natural Language Processing (NLP) unter Verwendung von Bibliotheken aus dem HuggingFace-Ökosystem (Python-basierte Deep-Learning-Bibliothek für LLMs) - Transformers, Datasets, Tokenizers und Accelerate - sowie der vortrainierten Hugging Face Hub-Modelle.
Design und Entwicklung von ML-Systemen für produktionsreife Anwendungen, die zuverlässig, skalierbar, wartbar und anpassungsfähig an sich ändernde Geschäftsanforderungen sind.
Entwicklung von MLOps-Pipelines für Automatisierung kontinuierliche Entwicklung, Bewertung und Bereitstellung von Modellen.
Entwicklung Überwachungssysteme zur schnellen Erkennung und Behebung von Problemen, auf die Modelle in der Produktion stoßen könnten.
End-to-End-Design und Implementierung von Datenanalysesystemen; Dazu gehören Datenerfassung, Anforderungsengineering und Spezifikation sowie die Konzeption von technischen Lösungen auf der Grundlage von Geschäftsanforderungen.
Ermittlung und Identifizierung von Möglichkeiten für die Gestaltung und Implementierung von Internet-Scale-Data-Mining-Lösungen in enger Zusammenarbeit mit anderen Data Scientists und Data Engineers.
Entwicklung von ETL-Pipelines für große und komplexe Datensätze; Verarbeitung von strukturierten und unstrukturierten Daten mit Spark, Pandas, Dask, Kafka usw.
Prototyping und Implementierung von massiv skalierten Data-Analytics-Lösungen auf der Basis von Big-Data-Werkzeugen (Spark, DWH, SQL, Python und R).
Arbeiten mit Cloud-Plattformen (AWS, Azure und Google Cloud).

Unsere Erwartungen an dich

Ausbildung

Masterabschluss in Informatik oder ähnliche quantitative Studiengänge wie Statistik, Operations Research, Bioinformatik, Mathematik oder Physik.

Qualifikationen

Fließende Deutsch- und / oder Englischkenntnisse.
Master in Informatik, Machine Learning oder ähnlichen technischen Feldern. (bevorzugt)

Erfahrung

1 Jahr Berufserfahrung oder akademische Erfahrung im Machine Learning und künstliche Intelligenz.
1 Jahr relevante Erfahrung im Bereich der Datenanalyse (Statistik / Datenwissenschaft).
Erfahrungen mit einem oder mehreren Mehrzweck-Programmiersprachen, einschließlich, aber nicht beschränkt auf: Java, C / C ++, Python, Scala oder R.
Erfahrungen mit einem oder mehreren der folgenden Themen: Natural Language Processing and Understanding, Klassifizierung, Mustererkennung und Empfehlungssysteme. (bevorzugt)
Erfahrung im Umgang mit großen Datenmengen, z. B. soziale Netzwerkdaten, wissenschaftliche Daten, Sensordaten usw. (bevorzugt)
Erfahrung in der Anwendung von Machine Learning auf großen Datensätzen. (bevorzugt)
Bewährte Programmierungserfahrung in mindestens einer Programmiersprache wie Java, Scala, C ++ oder einer ähnlichen objektorientierten Sprache. (bevorzugt)

Unser Angebot

Eine anregende und herausfordernde Arbeitsatmosphäre mit einer flachen Hierarchie und erfahrenen und hilfsbereiten Kollegen und Kolleginnen.
Eine umfassende Schulung und Ausbildung.
Themen, die wir in unserem Training abdecken werden: Big Data Science: Python Machine Learning Libs (NumPy, SciPy, Pandas, IPython, Scikit-Learn, PyTorch, TensorFlow, JAX,NLTK), Spark für Data Mining und Machine Learning (Spark SQL, Spark MLlib, PySpark).
Deep Neural Networks: Feed-Forward Neuronale Netze, Convolutional Netze, Recurrent Neuronale Netze, Entwicklung der Produktion bereiten TensorFlow, JAX und PyTorch Lösungen.
Data Science und Machine Learning Grundlagen: Zeitreihen und sequenzielle Datenverarbeitung, Supervised and Unsupervised Machine Learning, Klassifizierung.
Logistik Regression und Random Forest, Support Vektor Maschinen, K-Nearest Nachbarn, Naive Bayes und Gradient Boosting.
Generative Deep Learning und LLMs: Trainieren von einem großen Sprachmodell, welches kohärente Textabsätze generieren und bei vielen Sprachmodellierungs-Benchmarks Spitzenleistungen erzielen kann.
Zudem verfügt es über ein Leseverständnis und kann maschinelle Übersetzungen und die Beantwortung von Fragen und Zusammenfassungen durchführen. Dies alles geschieht ohne ein aufgabenspezifisches Training.

Themen mit denen du dich im Job beschäftigst

Job Standorte

Standort Köln
Nordrhein-Westfalen
Deutschland
Standort Köln
Nordrhein-Westfalen
Deutschland

Das ist dein Arbeitgeber

Qimia

Wir sind ein junges und dynamisches Inhabergeführtes IT Unternehmen. Wir unterstützen unsere Kunden durch die Realisierung maßgeschneiderter IT-Lösungen und verbinden dabei Bereiche wie Big Data Analytics, Business Intelligence und Data Warehousing, Cloud Services, Hadoop und Spark, Software Entwicklung in Scala, Python, Java Full Stack Development, Data Migration und gleichzeitig Projekt- und Prozessmanagement.

Unternehmenstyp: Etablierte Firma

Arbeitsmodell: Hybrid, Onsite

Branche: Internet, IT, Telekom

Data Engineer / Data Scientist

Qimia

Ort: Köln
Arbeitsmodell: Onsite
Diversität: Für alle Personen geeignet (m/w/d)

Data Engineer / Data Scientist

Job Zusammenfassung

Job Technologien

Deine Rolle im Team

Unsere Erwartungen an dich

Ausbildung

Qualifikationen

Erfahrung

Unser Angebot

Themen mit denen du dich im Job beschäftigst

Job Standorte

Standort Köln

Standort Köln

Das ist dein Arbeitgeber

Qimia

Weitere Jobs

Customer Data Consultant

Praktikum Applied AI Engineer

AI Data Scientist

Customer Data Consultant

Senior C# Developer

Process Automation / Integration Specialist

Karriere Tipps

Für Unternehmer

Unternehmen

Partner und Portale

Data Engineer / Data Scientist

Job

Job Zusammenfassung

Job Technologien

Deine Rolle im Team

Unsere Erwartungen an dich

Ausbildung

Qualifikationen

Erfahrung

Unser Angebot

Themen mit denen du dich im Job beschäftigst

Job Standorte

Standort Köln

Standort Köln

Das ist dein Arbeitgeber

Qimia

Description

Weitere Jobs

Customer Data Consultant

Praktikum Applied AI Engineer

AI Data Scientist