Categorías
···
Entrar / Registro
Ingeniero Senior de DevOps
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero Senior de DevOps para construir, configurar y operar fundamentos escalables de Kubernetes y computación Linux para cargas de trabajo intensivas en GPU, garantizando su fiabilidad y velocidad. Aspectos destacados: 1. Gestionar la programación de Kubernetes y Volcano para cargas de trabajo intensivas en GPU. 2. Automatizar flujos de trabajo mediante scripts en Python y UNIX Shell. 3. Colaborar con equipos para mejorar la eficiencia de la programación y los flujos de trabajo de los investigadores. Estamos implementando fundamentos escalables de Kubernetes y computación Linux para cargas de trabajo intensivas en GPU, y un Ingeniero Senior de DevOps ayudará a mantenerlos fiables y rápidos. Usted gestionará la programación de Kubernetes y Volcano, hará cumplir las cuotas y automatizará flujos de trabajo mediante scripts en Python y UNIX Shell en un entorno de entrega con interacción directa con clientes. ¡Postúlese ahora para unirse al equipo! **Responsabilidades** * Construir, configurar y operar clústeres de Kubernetes habilitados para GPU y entornos independientes de computación Linux para maximizar la programación y el rendimiento de las cargas de trabajo * Ejecutar de extremo a extremo la programación Volcano, incluida la creación de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas por espacio de nombres * Gestionar de forma integral los entornos de Kubernetes, incluidos los espacios de nombres, RBAC, cuotas de recursos y enfoques de aislamiento de cargas de trabajo * Crear y soportar scripts de automatización en Python y Shell para agilizar el envío de trabajos, el aprovisionamiento y la generación de informes * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, la utilización de capacidad y los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de recursos, y proporcionar datos para respaldar necesidades de optimización e informes * Proponer e impulsar mejoras en la infraestructura, las herramientas y los flujos de trabajo de automatización para incrementar el rendimiento, la escalabilidad y la usabilidad * Mantener procesos operativos que permitan una experiencia fluida y eficiente para los investigadores en cargas de trabajo de inteligencia artificial y computacionales **Requisitos** * Mínimo 3 años de experiencia en puestos de DevOps o ingeniería de infraestructura en entornos complejos y de gran escala * Conocimientos profundos en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica utilizando Volcano para la ejecución de trabajos en GPU, configuración de colas y priorización de cargas de trabajo integrada con Kubernetes * Experiencia demostrable en la ejecución de entornos de clústeres GPU en Kubernetes y en nodos de computación Linux independientes * Habilidades avanzadas en scripting en Python para automatización de infraestructura y sólidos conocimientos en scripting UNIX Shell, como Bash * Amplios conocimientos en administración de Linux, incluidas la resolución de problemas, la optimización del rendimiento y la gestión de configuraciones * Buen dominio de los conceptos y herramientas relacionadas con la automatización y orquestación de infraestructuras * Capacidad fluida de comunicación en inglés (hablado y escrito) para trabajar directamente con clientes **Deseable** * Conocimientos prácticos de Helm para empaquetado de aplicaciones en Kubernetes * Experiencia con herramientas de observabilidad tales como Prometheus, Grafana y Loki * Exposición a herramientas de Infraestructura como Código (IaC), incluido Terraform * Familiaridad con opciones multi-nube de Kubernetes, como Amazon EKS y Google GKE * Conocimientos de redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Capacidad para utilizar herramientas de codificación asistida por IA, como GitHub Copilot, ChatGPT y Claude * Comprensión de la programación y optimización de recursos híbridos (nube y locales)

Fuentea:  indeed Ver publicación original
Valentina Rodríguez
Indeed · HR

Compañía

Indeed
Valentina Rodríguez
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.