Categorías
···
Entrar / Registro
Ingeniero DevOps Intermedio
Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
79Q22222+22
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original
Descripción

Resumen: Únase a un equipo que opera y optimiza infraestructuras de Kubernetes y Linux con GPU para cómputo de IA a gran escala, centrándose en la fiabilidad y la automatización para mejorar la experiencia de los investigadores. Aspectos destacados: 1. Operar y ajustar clústeres de Kubernetes habilitados para GPU para un rendimiento optimizado 2. Desarrollar automatización en Python y Bash para flujos de trabajo de tareas e informes del sistema 3. Mejorar el rendimiento, la escalabilidad y la usabilidad de la infraestructura y las herramientas Actualmente operamos infraestructuras de Kubernetes y Linux con GPU que enfatizan la programación basada en Volcano, la fiabilidad y la automatización para cómputo de IA a gran escala. Como Ingeniero DevOps Intermedio, usted administrará entornos de Kubernetes y Linux, desarrollará automatización en Python y Bash para flujos de trabajo de tareas y colaborará estrechamente con las partes interesadas del cliente dentro de un equipo de entrega. Postúlese para ayudar a optimizar el rendimiento computacional y la experiencia de los investigadores en cargas de trabajo de IA exigentes. **Responsabilidades** * Operar y ajustar clústeres de Kubernetes habilitados para GPU y entornos de cómputo Linux independientes para mantener una programación y un rendimiento optimizados * Gestionar la programación de tareas mediante Volcano, incluida la configuración de colas, la ejecución de POD, la asignación de GPU y la aplicación de cuotas de espacio de nombres * Administrar Kubernetes de extremo a extremo con espacios de nombres, RBAC, cuotas de recursos y enfoques de aislamiento de cargas de trabajo * Crear y mantener automatización en Python y Shell para simplificar el envío de tareas, el aprovisionamiento de recursos y los informes del sistema * Colaborar con los equipos de orquestación, optimización y observabilidad para incrementar la eficiencia de la programación, mejorar la utilización de la capacidad y agilizar los flujos de trabajo de los investigadores * Medir la salud de la infraestructura y la utilización de los recursos, proporcionando datos y retroalimentación para necesidades de optimización e informes * Mejorar los flujos de trabajo de infraestructura, herramientas y automatización para aumentar el rendimiento, la escalabilidad y la usabilidad * Garantizar que las operaciones ofrezcan una experiencia fluida y eficiente a los investigadores que ejecutan diversas cargas de trabajo de IA y computacionales **Requisitos** * Experiencia práctica de 2+ años en ingeniería DevOps o infraestructura en entornos complejos y a gran escala * Conocimientos especializados en administración y orquestación de Kubernetes, incluidos espacios de nombres, programación/distribución de POD, PVC, NFS y gestión de cuotas de recursos * Experiencia práctica con el programador Volcano para ejecución de tareas con GPU, configuración de colas y priorización de cargas de trabajo integrada con Kubernetes * Capacidad comprobada para operar entornos de clústeres con GPU en Kubernetes, así como en nodos de cómputo Linux independientes * Habilidades avanzadas de scripting en Python para automatización de infraestructura, además de competencia en scripting UNIX como Bash * Sólidas habilidades de administración de sistemas Linux, incluida la solución de problemas, la optimización del rendimiento y la gestión de configuraciones * Comprensión sólida de los conceptos y herramientas relacionadas con la automatización y orquestación de infraestructuras * Competencia fluida en inglés (hablado y escrito) para interacción directa con clientes **Deseable** * Conocimientos sobre la gestión de paquetes Helm para aplicaciones de Kubernetes * Familiaridad con soluciones de monitoreo y observabilidad, especialmente Prometheus, Grafana y Loki * Habilidades en herramientas de Infraestructura como Código (IaC), tales como Terraform * Experiencia en entornos de Kubernetes multi-nube, incluidos Amazon EKS y Google GKE * Conocimiento de redes de Azure, incluidas VPN, ExpressRoute y seguridad de red * Familiaridad con herramientas de codificación asistida por IA, como GitHub Copilot, ChatGPT y Claude * Experiencia en programación y optimización de recursos híbridos (nube y local)

Fuentea:  indeed Ver publicación original
Valentina Rodríguez
Indeed · HR

Compañía

Indeed
Valentina Rodríguez
Indeed · HR
Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.