What This Role Could Look Like
- Multi-camera calibration, SfM, bundle adjustment, mesh processing
- Inverse rendering: material and geometry estimation from images
- Differentiable rendering and appearance decomposition
- Generative 3D reconstruction: diffusion-based approaches, feed-forward networks
- BRDF modeling and physically-based material synthesis
- Integration of classical and learned components into production pipelines
|
Positionsübersicht
- Entwurf und Verwaltung von Datenspeichersystemen für große Datensätze (Multi-TB-Bilddaten, 3D-Assets, Trainingsdaten)
- Entwicklung effizienter Datenzugriffsmuster und Bewegungsstrategien für verteiltes Training und Experimentieren
- Implementierung der Versionierung von Datensätzen und Verfolgung der Abstammung für die Reproduzierbarkeit
- Einrichtung und Pflege der Infrastruktur für Experimentverfolgung und Modellregistrierung (MLflow, Weights & Biases)
- Aufbau von ML-Pipelines für Datenvorverarbeitung, Training, Validierung und Modellregistrierung (Kubeflow, Airflow, Prefect)
- Unterstützung verteilter Trainingsworkflows über Multi-GPU-Cluster (PyTorch Distributed, Horovod, Ray)
- Profilierung und Optimierung von Trainingspipelines: Engpässe beim Laden von Daten, Batch-Sizing, GPU-Speicherauslastung
- Sicherstellung der Reproduzierbarkeit von Experimenten: Umgebungspinning, Datenversionierung, Artefaktmanagement
- Verwaltung der Speicherung und Verteilung von Artefakten (Docker-Registrierungen, Modell-Registrierungen, Paket-Repositories)
- Entwicklung von Werkzeugen zur Verbesserung der Entwicklerproduktivität für ML-Workflows
|
Positionsübersicht
- Bereitstellung, Konfiguration und Wartung von heterogenen Compute-Clustern (CPU/GPU) an mehreren physischen Standorten
- Implementierung von dynamischem Compute- und Storage-Provisioning auf Basis von Workload-Anforderungen
- Entwicklung von Speicherlösungen sowohl auf Hardware- als auch auf Softwareebene (NAS, verteilte Dateisysteme, Storage Tiering)
- Implementierung und Verwaltung von Container-Orchestrierungssystemen (Kubernetes, Docker) für Entwicklungs- und Produktions-Workloads
- Entwurf und Wartung von Infrastruktur als Code mit Tools wie Terraform und Ansible
- Aufbau und Optimierung von Systemen zur Auftragsplanung und Ressourcenzuweisung (Slurm, Kubernetes)
- Einrichtung einer Infrastruktur für Überwachung, Alarmierung und Beobachtung (Prometheus, Grafana, IPMI)
- Profilierung und Optimierung der Leistung auf Systemebene: GPU-Auslastung, Speicherbandbreite, I/O-Durchsatz, Netzwerklatenz
- Verwalten von Netzwerken, VPNs und sicherem Zugriff über verteilte Systeme hinweg
- Handhabung von Zuverlässigkeitsaspekten: Erkennung von Hardwareausfällen, Checkpointing von Jobs, Disaster Recovery
|
Was du bei uns machst:
- Du unterstützt die Organisation, Umsetzung und Vermarktung von Masterclass-Modulen, Webinaren und Campus-Events.
- Du erstellst, bearbeitest und pflegst Content für die Academy: Website, Newsletter, Social Media und E-Learning.
- Du gestaltest Präsentationen, Unterlagen und Lernmaterialien für unterschiedlichste Hospitality-Themen.
- Du wirkst bei Wettbewerbsrecherchen, Analysen und Reportings unserer Academy-Produkte mit.
- Du arbeitest eng mit dem Academy- und Marketing-Team zusammen und bringst deine Ideen aktiv ein.
|
YOUR RESPONSABILITIES
- Perform complex troubleshooting, upgrades and commissioning tasks across global locations
- Provide on-site support for special customer cases, pilot installations and escalated technical issues
- Support international service teams through targeted interventions and expertise sharing
- Deliver remote technical guidance to our Field Service Technicians via phone, video call and digital tools
- Contribute to internal training programs and help shape hands-on learning experiences for new Technicians
- Collaborate on strategic projects, including prototype testing, product enhancements and process optimization
|