Deine Aufgaben:
- Du bist Teil des Site-Relialibty-Engeering Teams und unterstützt den Aufbau einer hochperformanten Cloud-Plattform auf Basis von OpenStack mit Fokus auf Skalierung und Erweiterung über Rechenzentrums- und Landesgrenzen hinaus
- Du betreibst und optimierst kontinuierlich die technischen Prozessabläufe durch effiziente Automatisierung und Weiterentwicklung in den Programmiersprachen Golang und/oder Python
- Du verantwortest und optimierst die Bereitstellung von Baremetal-Resourcen verschiedenster Hersteller auf Basis von OpenStack Ironic und internen und/oder OpenSource-basierten Tools
- Du betreibst und verwaltest die umgebende Linux-basierten Systemlandschaften (z.B. Kubernetes, Proxmox) und gewährleistest die hohe Verfügbarkeit unserer Cloud-Infrastruktur
- Du erstellst und pflegst Dokumentationen und sorgst für die Implementierung und Wartung von Monitoring und Logging (z.B. Prometheus, Grafana, ELK Stack) für einen stabilen Betrieb der Plattform
- Du bist Teil eines motivierten Teams, das jederzeit nach Verbesserungen strebt und sich (und die Produkte) kontinuierlich weiterentwickelt
Dein Profil:
- Du bringst die Leidenschaft und Begeisterung für neue Technologien und Themen rund um Linux, Automatisierung, Virtualisierung und Netzwerk mit
- Du treibst aktiv die Verbesserung der Verfügbarkeit und Skalierung voran und bist bestrebst Prozessabläufe zu automatisieren
- Du bist in der Lage, komplexe technische Probleme zu analysieren und effizient zu lösen und hast Erfahrung in der Durchführung von Root Cause Analysen
- Du hast umfassende, mehrjährige Erfahrung in der Implementierung und Verwaltung von OpenStack- und Kubernetes-Umgebungen, einschließlich der Bereitstellung, Skalierung und Optimierung
- Du hast umfassende Erfahrung im Bereich der Softwareentwicklung, bis hin zu Build- und Releasemanagement, und überzeugst uns mit deiner fortgeschrittenen Programmiererfahrung, insbesondere in Python und/oder Golang