Job
- Level
- Erfahren
- Job Feld
- Data
- Anstellung
- Vollzeit
- Vertragsart
- Unbefristetes Dienstverhältnis
- Ort
- Köln
- Arbeitsmodell
- Onsite
Job Zusammenfassung
In dieser Position entwickelst du innovative AI- und Machine-Learning-Lösungen, insbesondere Generative Deep Learning Modelle, und implementierst datengetriebene Systeme mithilfe von Python-Tools in einer Cloud-Umgebung.
Job Technologien
Deine Rolle im Team
- Aufbau von innovativer AI- und Machine-Learning-Lösungen.
- Entwicklung von Generative Deep Learning Models: Erstellen, trainieren und fine-tuning neuraler Netzwerke mit Python-Tools Torch, Numpy, Pandas, PySpark, Jupyter, Transformers, Datasets, Tiktoken und Wandb.
- Natural Language Processing (NLP) unter Verwendung von Bibliotheken aus dem HuggingFace-Ökosystem (Python-basierte Deep-Learning-Bibliothek für LLMs) - Transformers, Datasets, Tokenizers und Accelerate - sowie der vortrainierten Hugging Face Hub-Modelle.
- Design und Entwicklung von ML-Systemen für produktionsreife Anwendungen, die zuverlässig, skalierbar, wartbar und anpassungsfähig an sich ändernde Geschäftsanforderungen sind.
- Entwicklung von MLOps-Pipelines für Automatisierung kontinuierliche Entwicklung, Bewertung und Bereitstellung von Modellen.
- Entwicklung Überwachungssysteme zur schnellen Erkennung und Behebung von Problemen, auf die Modelle in der Produktion stoßen könnten.
- End-to-End-Design und Implementierung von Datenanalysesystemen; Dazu gehören Datenerfassung, Anforderungsengineering und Spezifikation sowie die Konzeption von technischen Lösungen auf der Grundlage von Geschäftsanforderungen.
- Ermittlung und Identifizierung von Möglichkeiten für die Gestaltung und Implementierung von Internet-Scale-Data-Mining-Lösungen in enger Zusammenarbeit mit anderen Data Scientists und Data Engineers.
- Entwicklung von ETL-Pipelines für große und komplexe Datensätze; Verarbeitung von strukturierten und unstrukturierten Daten mit Spark, Pandas, Dask, Kafka usw.
- Prototyping und Implementierung von massiv skalierten Data-Analytics-Lösungen auf der Basis von Big-Data-Werkzeugen (Spark, DWH, SQL, Python und R).
- Arbeiten mit Cloud-Plattformen (AWS, Azure und Google Cloud).
Unsere Erwartungen an dich
Ausbildung
- Masterabschluss in Informatik oder ähnliche quantitative Studiengänge wie Statistik, Operations Research, Bioinformatik, Mathematik oder Physik.
Qualifikationen
- Fließende Deutsch- und / oder Englischkenntnisse.
- Master in Informatik, Machine Learning oder ähnlichen technischen Feldern. (bevorzugt)
Erfahrung
- 1 Jahr Berufserfahrung oder akademische Erfahrung im Machine Learning und künstliche Intelligenz.
- 1 Jahr relevante Erfahrung im Bereich der Datenanalyse (Statistik / Datenwissenschaft).
- Erfahrungen mit einem oder mehreren Mehrzweck-Programmiersprachen, einschließlich, aber nicht beschränkt auf: Java, C / C ++, Python, Scala oder R.
- Erfahrungen mit einem oder mehreren der folgenden Themen: Natural Language Processing and Understanding, Klassifizierung, Mustererkennung und Empfehlungssysteme. (bevorzugt)
- Erfahrung im Umgang mit großen Datenmengen, z. B. soziale Netzwerkdaten, wissenschaftliche Daten, Sensordaten usw. (bevorzugt)
- Erfahrung in der Anwendung von Machine Learning auf großen Datensätzen. (bevorzugt)
- Bewährte Programmierungserfahrung in mindestens einer Programmiersprache wie Java, Scala, C ++ oder einer ähnlichen objektorientierten Sprache. (bevorzugt)
Unser Angebot
- Eine anregende und herausfordernde Arbeitsatmosphäre mit einer flachen Hierarchie und erfahrenen und hilfsbereiten Kollegen und Kolleginnen.
- Eine umfassende Schulung und Ausbildung.
- Themen, die wir in unserem Training abdecken werden: Big Data Science: Python Machine Learning Libs (NumPy, SciPy, Pandas, IPython, Scikit-Learn, PyTorch, TensorFlow, JAX,NLTK), Spark für Data Mining und Machine Learning (Spark SQL, Spark MLlib, PySpark).
- Deep Neural Networks: Feed-Forward Neuronale Netze, Convolutional Netze, Recurrent Neuronale Netze, Entwicklung der Produktion bereiten TensorFlow, JAX und PyTorch Lösungen.
- Data Science und Machine Learning Grundlagen: Zeitreihen und sequenzielle Datenverarbeitung, Supervised and Unsupervised Machine Learning, Klassifizierung.
- Logistik Regression und Random Forest, Support Vektor Maschinen, K-Nearest Nachbarn, Naive Bayes und Gradient Boosting.
- Generative Deep Learning und LLMs: Trainieren von einem großen Sprachmodell, welches kohärente Textabsätze generieren und bei vielen Sprachmodellierungs-Benchmarks Spitzenleistungen erzielen kann.
- Zudem verfügt es über ein Leseverständnis und kann maschinelle Übersetzungen und die Beantwortung von Fragen und Zusammenfassungen durchführen. Dies alles geschieht ohne ein aufgabenspezifisches Training.
Themen mit denen du dich im Job beschäftigst
Job Standorte
Das ist dein Arbeitgeber
Qimia
Wir sind ein junges und dynamisches Inhabergeführtes IT Unternehmen. Wir unterstützen unsere Kunden durch die Realisierung maßgeschneiderter IT-Lösungen und verbinden dabei Bereiche wie Big Data Analytics, Business Intelligence und Data Warehousing, Cloud Services, Hadoop und Spark, Software Entwicklung in Scala, Python, Java Full Stack Development, Data Migration und gleichzeitig Projekt- und Prozessmanagement.
Description
- Unternehmenstyp
- Etablierte Firma
- Arbeitsmodell
- Hybrid, Onsite
- Branche
- Internet, IT, Telekom