3 Deep Learning Jobs in Südtirol
Positionsübersicht
- Entwurf und Verwaltung von Datenspeichersystemen für große Datensätze (Multi-TB-Bilddaten, 3D-Assets, Trainingsdaten)
- Entwicklung effizienter Datenzugriffsmuster und Bewegungsstrategien für verteiltes Training und Experimentieren
- Implementierung der Versionierung von Datensätzen und Verfolgung der Abstammung für die Reproduzierbarkeit
- Einrichtung und Pflege der Infrastruktur für Experimentverfolgung und Modellregistrierung (MLflow, Weights & Biases)
- Aufbau von ML-Pipelines für Datenvorverarbeitung, Training, Validierung und Modellregistrierung (Kubeflow, Airflow, Prefect)
- Unterstützung verteilter Trainingsworkflows über Multi-GPU-Cluster (PyTorch Distributed, Horovod, Ray)
- Profilierung und Optimierung von Trainingspipelines: Engpässe beim Laden von Daten, Batch-Sizing, GPU-Speicherauslastung
- Sicherstellung der Reproduzierbarkeit von Experimenten: Umgebungspinning, Datenversionierung, Artefaktmanagement
- Verwaltung der Speicherung und Verteilung von Artefakten (Docker-Registrierungen, Modell-Registrierungen, Paket-Repositories)
- Entwicklung von Werkzeugen zur Verbesserung der Entwicklerproduktivität für ML-Workflows
|
Positionsübersicht
- Bereitstellung, Konfiguration und Wartung von heterogenen Compute-Clustern (CPU/GPU) an mehreren physischen Standorten
- Implementierung von dynamischem Compute- und Storage-Provisioning auf Basis von Workload-Anforderungen
- Entwicklung von Speicherlösungen sowohl auf Hardware- als auch auf Softwareebene (NAS, verteilte Dateisysteme, Storage Tiering)
- Implementierung und Verwaltung von Container-Orchestrierungssystemen (Kubernetes, Docker) für Entwicklungs- und Produktions-Workloads
- Entwurf und Wartung von Infrastruktur als Code mit Tools wie Terraform und Ansible
- Aufbau und Optimierung von Systemen zur Auftragsplanung und Ressourcenzuweisung (Slurm, Kubernetes)
- Einrichtung einer Infrastruktur für Überwachung, Alarmierung und Beobachtung (Prometheus, Grafana, IPMI)
- Profilierung und Optimierung der Leistung auf Systemebene: GPU-Auslastung, Speicherbandbreite, I/O-Durchsatz, Netzwerklatenz
- Verwalten von Netzwerken, VPNs und sicherem Zugriff über verteilte Systeme hinweg
- Handhabung von Zuverlässigkeitsaspekten: Erkennung von Hardwareausfällen, Checkpointing von Jobs, Disaster Recovery
|
Positionsübersicht
- Entwicklung von neuronalen 3D-Systemen
- Erstellung und Optimierung von neuronalen inversen Rendering-Modellen für Geometrie- und Materialschätzungen
- Entwicklung von Pipelines für Relighting und Dekomposition von Erscheinungsbildern unter Verwendung differenzierbarer Rendering-Techniken
- Erforschung von generativen Rekonstruktionsansätzen: diffusionsbasiertes 3D, Feed-Forward-Rekonstruktionsnetzwerke, neuronale Szenendarstellungen
- Bewältigung anspruchsvoller Szenarien: spiegelnde und transparente Oberflächen, dünne Strukturen, komplexe BRDFs
- Schreiben Sie sauberen, produktionsreifen Code und verbessern Sie die Qualität der Modelle und die Geschwindigkeit der Schlussfolgerungen
- Zusammenarbeit & Erkundung
- Zusammenarbeit mit Rendering-Spezialisten und Systementwicklern, um gelernte Komponenten in die Pipeline zu integrieren
- Zusammenarbeit mit Unternehmenskunden zur Erfassung von Anforderungen und zur Weiterentwicklung von Fähigkeiten
- Halten Sie sich über CVPR, SIGGRAPH und verwandte Forschungsarbeiten auf dem Laufenden; identifizieren Sie Methoden, die in die Produktion einfließen sollen
|