




**Ingeniero Senior de Aprendizaje Automático (IA Generativa)** ============================== Colombia, Medellín, Antioquia, Bogotá, Distrito Capital, Cali, Valle del Cauca, Barranquilla, Área Metropolitana de Bucaramanga, Bucaramanga, Santander **Acerca del proyecto** Como Ingeniero Senior de Aprendizaje Automático en Provectus, será responsable de diseñar, desarrollar e implementar soluciones de aprendizaje automático listas para producción para nuestros clientes. Trabajarás en problemas complejos de aprendizaje automático, orientarás a ingenieros junior y contribuirás a la creación de aceleradores de aprendizaje automático y buenas prácticas. **Responsabilidades principales:** * 1. Entrega técnica (60%) + Diseñar e implementar soluciones integrales de aprendizaje automático, desde la experimentación hasta la producción + Construir pipelines y infraestructura de aprendizaje automático escalables + Optimizar el rendimiento, la eficiencia y la confiabilidad de los modelos + Escribir código limpio, mantenible y de calidad para producción + Realizar experimentaciones rigurosas y evaluación de modelos + Diagnosticar y resolver desafíos técnicos complejos * 2. Colaboración y contribución (25%) + Orientar a ingenieros junior y de nivel intermedio en aprendizaje automático + Realizar revisiones de código y proporcionar retroalimentación constructiva + Compartir conocimientos mediante documentación, presentaciones y talleres + Colaborar con equipos multifuncionales (DevOps, Ingeniería de Datos, Analistas de Sistemas) + Contribuir al desarrollo de prácticas internas de aprendizaje automático * 3. Innovación y crecimiento (15%) + Mantenerse actualizado sobre la investigación en aprendizaje automático y las tecnologías emergentes + Proponer mejoras a soluciones y procesos existentes + Contribuir al desarrollo de aceleradores reutilizables de aprendizaje automático + Participar en discusiones técnicas y decisiones arquitectónicas **Requisitos:** * 1. Fundamentos de aprendizaje automático + Fundamentos de ML: aprendizaje supervisado, no supervisado y por refuerzo + Desarrollo de modelos: ingeniería de características, entrenamiento de modelos, evaluación, ajuste de hiperparámetros y validación + Marcos de ML: bibliotecas clásicas de ML, TensorFlow, PyTorch o marcos similares + Aprendizaje profundo: CNN, RNN, Transformers * 2. Modelos de lenguaje grande (LLM) e IA generativa + Aplicaciones de LLM: experiencia en el desarrollo de aplicaciones basadas en LLM para producción + Ingeniería de indicaciones (prompt engineering): capacidad para diseñar indicaciones efectivas y estrategias de cadena de razonamiento + Sistemas RAG: experiencia en la construcción de arquitecturas de generación aumentada por recuperación + Bases de datos vectoriales: familiaridad con modelos de incrustación (embedding) y búsqueda vectorial + Evaluación de LLM: experiencia con métricas y técnicas de evaluación de salidas de LLM * 3. Datos y programación + Python: dominio avanzado de Python para aplicaciones de aprendizaje automático + Manipulación de datos: experiencia experta con pandas, numpy y bibliotecas de procesamiento de datos + SQL: capacidad para trabajar con datos estructurados y bases de datos * - Pipelines de datos: experiencia en la construcción de pipelines ETL/ELT - Big Data: experiencia con Spark o marcos similares de computación distribuida * 4. MLOps y producción + Implementación de modelos: experiencia en la implementación de modelos de aprendizaje automático en entornos de producción + Contenerización: dominio de Docker y orquestación de contenedores + CI/CD: comprensión de la integración y despliegue continuos para aprendizaje automático + Monitoreo: experiencia en monitoreo de modelos y observabilidad + Seguimiento de experimentos: familiaridad con MLflow, Weights and Biases u herramientas similares * 5. Nube e infraestructura + Servicios de AWS: experiencia sólida con servicios de ML de AWS (SageMaker, Lambda, etc.) + Conocimientos avanzados de GCP: conocimientos avanzados de servicios de ML y datos de GCP + Arquitectura en la nube: comprensión de arquitecturas de ML nativas en la nube + Infraestructura como código: experiencia con Terraform, CloudFormation o similares **Será un plus:** * Experiencia práctica con plataformas en la nube (se prefiere la pila de AWS, por ejemplo Amazon SageMaker, ECR, EMR, S3, AWS Lambda). * Experiencia práctica con modelos de aprendizaje profundo. * Experiencia con taxonomías u ontologías. * Experiencia práctica con pipelines de aprendizaje automático para coordinar flujos de trabajo complejos. * Experiencia práctica con Spark/Dask, Great Expectations.


