Categorías
···
Entrar / Registro
Ingeniero DevOps Intermedio
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Buscamos un Ingeniero DevOps Intermedio para operar y automatizar plataformas informáticas resilientes basadas en Kubernetes y Linux con GPU destinadas a cargas de trabajo avanzadas de IA, colaborando con un equipo de entrega orientado al cliente. Aspectos destacados: 1. Construir plataformas informáticas fiables y de alto rendimiento para cargas de trabajo avanzadas de IA. 2. Automatizar flujos de trabajo con Python y scripts de shell UNIX. 3. Administrar Kubernetes de extremo a extremo para una programación optimizada de GPU. Estamos entregando plataformas resilientes de Kubernetes y Linux optimizadas para la programación de GPU y la automatización a gran escala en entornos informáticos de IA. Como Ingeniero DevOps Intermedio, usted operará clústeres de Kubernetes (incluido Volcano) y clústeres de GPU Linux, automatizará flujos de trabajo con Python y scripts de shell UNIX, y colaborará con un equipo de entrega orientado al cliente. Postúlese para ayudar a construir plataformas informáticas fiables y de alto rendimiento para cargas de trabajo avanzadas de IA. **Responsabilidades** * Implementar, configurar y ejecutar clústeres de Kubernetes habilitados para GPU y entornos informáticos Linux independientes, manteniendo una programación y un rendimiento optimizados * Implementar y gestionar la programación de trabajos mediante Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas de espacio de nombres * Administrar Kubernetes de extremo a extremo, incluidos los espacios de nombres, RBAC, las cuotas de recursos y los enfoques de aislamiento de cargas de trabajo * Desarrollar y mantener automatizaciones en Python y Shell para simplificar la presentación de trabajos, el aprovisionamiento de recursos y la generación de informes del sistema * Colaborar con equipos de orquestación, optimización y observabilidad para mejorar la eficiencia de la programación, incrementar la utilización de la capacidad y agilizar los flujos de trabajo de los investigadores * Supervisar la salud de la infraestructura y la utilización de los recursos, proporcionando datos y retroalimentación para necesidades de optimización e informes * Identificar oportunidades para mejorar la infraestructura, las herramientas y los flujos de trabajo de automatización con el fin de elevar el rendimiento, la escalabilidad y la usabilidad * Garantizar que los procesos operativos ofrezcan una experiencia fluida y eficiente a los investigadores que ejecutan diversas cargas de trabajo de IA y computacionales **Requisitos** * Experiencia práctica de 2+ años en DevOps o ingeniería de infraestructura en entornos complejos y a gran escala * Conocimientos profundos en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica en el uso del programador Volcano para la ejecución de trabajos con GPU, la configuración de colas y la priorización de cargas de trabajo integrada con Kubernetes * Capacidad demostrada para operar entornos de clústeres con GPU en Kubernetes y en nodos informáticos Linux independientes * Habilidades avanzadas de programación en Python para la automatización de infraestructura, además de competencia en scripting de shell UNIX, como Bash * Sólidas habilidades en administración de sistemas Linux, incluida la resolución de problemas, la optimización del rendimiento y la gestión de configuraciones * Comprensión sólida de los conceptos de automatización y orquestación de infraestructura y las herramientas relacionadas * Dominio fluido del inglés (hablado y escrito) para interacción directa con clientes **Deseable** * Conocimientos sobre la gestión de paquetes Helm para aplicaciones de Kubernetes * Familiaridad con soluciones de monitorización y observabilidad, especialmente Prometheus, Grafana y Loki * Habilidades en herramientas de Infraestructura como Código (IaC), como Terraform * Experiencia en entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimientos sobre redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de programación asistida por IA, como GitHub Copilot, ChatGPT y Claude * Experiencia en programación y optimización de recursos híbridos (nube y locales)

Fuentea:  indeed Ver publicación original
Valentina Rodríguez
Indeed · HR

Compañía

Indeed
Valentina Rodríguez
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.