Ingeniero Senior de Datos/Aprendizaje Automático

Salario negociable

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

111411, Los Mártires, Bogotá, Colombia

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Esta es una oportunidad de trabajo a tiempo completo desde casa para un destacado **Ingeniero de Datos/Aprendizaje Automático de LATAM.** IDT (www.idt.net) es una empresa estadounidense de telecomunicaciones fundada en 1990 con sede en Nueva Jersey. Hoy es líder en la industria de servicios de comunicación y pago prepagos, y uno de los mayores proveedores mundiales de voz internacional. Estamos cotizados en la Bolsa de Nueva York, empleamos a más de 1300 personas en más de 20 países y tenemos ingresos superiores a 1500 millones de dólares. Estamos buscando un Ingeniero de Datos/Aprendizaje Automático experimentado para unirse a nuestro equipo de BI y desempeñar un papel activo en el diseño, construcción y mantenimiento de la canalización de extremo a extremo, arquitectura y diseño que alimentan nuestro almacén de datos, aplicaciones basadas en modelos de lenguaje grandes (LLM) y BI basada en IA. **¡Si estás buscando una empresa que te ofrezca la máxima flexibilidad para elegir tu ubicación de trabajo, esta oportunidad es para ti!** ### **Responsabilidades:** * Diseñar, desarrollar y mantener tuberías de datos escalables para soportar la ingesta, transformación y entrega en almacenes centrales de características, flujos de entrenamiento de modelos y servicios de inferencia en tiempo real. * Construir y optimizar flujos de trabajo para extraer, almacenar y recuperar representaciones semánticas de datos no estructurados, permitiendo patrones avanzados de búsqueda y recuperación. * Diseñar e implementar soluciones ligeras de análisis y tableros que ofrezcan experiencias de consulta en lenguaje natural y conocimientos respaldados por IA. * Definir y ejecutar procesos para gestionar técnicas de ingeniería de indicaciones (prompt engineering), flujos de orquestación y rutinas de ajuste fino de modelos para impulsar interfaces conversacionales. * Supervisar almacenes de datos vectoriales y desarrollar metodologías eficientes de indexación para soportar flujos de trabajo de generación aumentada por recuperación (RAG). * Colaborar con interesados en los datos para recopilar requisitos sobre iniciativas de modelos de lenguaje y traducirlos en soluciones escalables. * Crear y mantener documentación completa de todos los procesos de datos, flujos de trabajo y rutinas de despliegue de modelos. * Debe estar dispuesto a mantenerse informado y aprender nuevas metodologías emergentes en ingeniería de datos, MLOps y operaciones de LLM. ### **Requisitos:** * 8 o más años de experiencia como Ingeniero de Datos, con al menos 2 años enfocados en MLOps. * Excelentes habilidades comunicativas en inglés. * Habilidades efectivas de comunicación oral y escrita con el equipo de BI y la comunidad de usuarios. * Experiencia demostrada utilizando Python para tareas de ingeniería de datos, incluyendo transformación, manipulación avanzada de datos y procesamiento de datos a gran escala. * Comprensión profunda de bases de datos vectoriales y arquitecturas RAG, y cómo impulsan flujos de trabajo de recuperación semántica. * Habilidad para integrar frameworks de LLM de código abierto en flujos de trabajo de ingeniería de datos para entrenamiento end-to-end, personalización y inferencia escalable. * Experiencia con plataformas en la nube como AWS o Azure Machine Learning para despliegues administrados de LLM. * Experiencia práctica con tecnologías de big data como Apache Spark, Hadoop y Kafka para procesamiento distribuido e ingesta de datos en tiempo real. * Experiencia diseñando tuberías de datos complejas que extraigan datos de fuentes RDBMS, JSON, API y archivos planos. * Habilidades demostradas en programación SQL y PLSQL, con dominio avanzado en metodologías de Business Intelligence y almacenes de datos, junto con experiencia práctica en uno o más sistemas de bases de datos relacionales y servicios de bases de datos en la nube como Snowflake/Redshift. * Comprensión de principios de ingeniería de software y experiencia trabajando en sistemas operativos Unix/Linux/Windows, así como experiencia con metodologías ágiles. * Dominio de sistemas de control de versiones, con experiencia en la gestión de repositorios de código, ramificación, fusión y colaboración en entornos de desarrollo distribuidos. * Interés en las operaciones empresariales y comprensión integral de cómo los sistemas robustos de BI impulsan la rentabilidad corporativa mediante la toma de decisiones basadas en datos y conocimientos estratégicos. ### **Atributos Deseables** * Experiencia con bases de datos vectoriales como DataStax AstraDB, y desarrollo de aplicaciones impulsadas por LLM usando frameworks populares de código abierto como LangChain y LlamaIndex, incluyendo ingeniería de indicaciones (prompt engineering), generación aumentada por recuperación (RAG) y orquestación de flujos de trabajo inteligentes. * Conocimiento sobre evaluación e integración de frameworks de LLM de código abierto, como Hugging Face Transformers/LLaMA-4 en flujos de trabajo completos, incluyendo ajuste fino y optimización de inferencia. * Conocimientos sobre herramientas de MLOps y tuberías CI/CD para gestionar el versionado de modelos y despliegues automatizados. **Por favor adjunte su CV en inglés.** El proceso de entrevista se realizará en inglés. **Solo aceptamos candidatos de LATAM.**

Fuentea: indeed Ver publicación original