4 Forscher Jobs in Südtirol
Zulassungsvoraussetzungen
- mind. vierjähriger Hochschulabschluss im technisch-naturwissenschaftlichen Bereich
- Zweisprachigkeitsnachweis C1 (ehem. Niveau A) oder gleichwertige Sprachzertifikate C1 in den vier Fertigkeiten (Hören, Lesen, Schreiben, Sprechen)
- mehrjährige Berufserfahrung in Forschungslaboratorien (bitte geben Sie diese Erfahrung im Bewerbungsformular und im CV an)
|
Positionsübersicht
- Bereitstellung, Konfiguration und Wartung von heterogenen Compute-Clustern (CPU/GPU) an mehreren physischen Standorten
- Implementierung von dynamischem Compute- und Storage-Provisioning auf Basis von Workload-Anforderungen
- Entwicklung von Speicherlösungen sowohl auf Hardware- als auch auf Softwareebene (NAS, verteilte Dateisysteme, Storage Tiering)
- Implementierung und Verwaltung von Container-Orchestrierungssystemen (Kubernetes, Docker) für Entwicklungs- und Produktions-Workloads
- Entwurf und Wartung von Infrastruktur als Code mit Tools wie Terraform und Ansible
- Aufbau und Optimierung von Systemen zur Auftragsplanung und Ressourcenzuweisung (Slurm, Kubernetes)
- Einrichtung einer Infrastruktur für Überwachung, Alarmierung und Beobachtung (Prometheus, Grafana, IPMI)
- Profilierung und Optimierung der Leistung auf Systemebene: GPU-Auslastung, Speicherbandbreite, I/O-Durchsatz, Netzwerklatenz
- Verwalten von Netzwerken, VPNs und sicherem Zugriff über verteilte Systeme hinweg
- Handhabung von Zuverlässigkeitsaspekten: Erkennung von Hardwareausfällen, Checkpointing von Jobs, Disaster Recovery
|
Positionsübersicht
- Entwurf und Verwaltung von Datenspeichersystemen für große Datensätze (Multi-TB-Bilddaten, 3D-Assets, Trainingsdaten)
- Entwicklung effizienter Datenzugriffsmuster und Bewegungsstrategien für verteiltes Training und Experimentieren
- Implementierung der Versionierung von Datensätzen und Verfolgung der Abstammung für die Reproduzierbarkeit
- Einrichtung und Pflege der Infrastruktur für Experimentverfolgung und Modellregistrierung (MLflow, Weights & Biases)
- Aufbau von ML-Pipelines für Datenvorverarbeitung, Training, Validierung und Modellregistrierung (Kubeflow, Airflow, Prefect)
- Unterstützung verteilter Trainingsworkflows über Multi-GPU-Cluster (PyTorch Distributed, Horovod, Ray)
- Profilierung und Optimierung von Trainingspipelines: Engpässe beim Laden von Daten, Batch-Sizing, GPU-Speicherauslastung
- Sicherstellung der Reproduzierbarkeit von Experimenten: Umgebungspinning, Datenversionierung, Artefaktmanagement
- Verwaltung der Speicherung und Verteilung von Artefakten (Docker-Registrierungen, Modell-Registrierungen, Paket-Repositories)
- Entwicklung von Werkzeugen zur Verbesserung der Entwicklerproduktivität für ML-Workflows
|
Der Aufgabenbereich umfasst u.a.
- die Betreuung und Weiterentwicklung der Werkstatt sowie der weitere Auf- bzw. Ausbau derselben
- die tägliche Bedienung und Instandhaltung der Geräte und Maschinen und die Unterstützung der Studierenden und Forscher:innen bei der Umsetzung ihrer Projekte
- die Mitarbeit in sämtlichen Sicherheitsangelegenheiten der Werkstatt
- die Planung und Durchführung von werkstattbezogenen Fachkursen für Studierende, sowohl die Grundkurse als auch jene für Fortgeschrittene
- die Erstellung von Budgetvorschlägen für den Erwerb von neuen Geräten und technischem Material
- die Unterstützung bei der Auswahl sowie bei der Inbetriebnahme von neuen Geräten oder Maschinen und bei der Abwicklung der Einkäufe und Zurverfügungstellung des Verbrauchsmaterials.
|