




Esta es una oportunidad de trabajo a tiempo completo desde casa para un destacado **Ingeniero de Datos/Aprendizaje Automático de LATAM.** IDT (www.idt.net) es una empresa estadounidense de telecomunicaciones fundada en 1990 con sede en Nueva Jersey. Hoy es líder en la industria de servicios de comunicación y pago prepagos, y uno de los mayores proveedores mundiales de voz internacional. Estamos cotizados en la Bolsa de Nueva York, empleamos a más de 1300 personas en más de 20 países y tenemos ingresos superiores a 1500 millones de dólares. Estamos buscando un Ingeniero de Datos/Aprendizaje Automático experimentado para unirse a nuestro equipo de BI y desempeñar un papel activo en el diseño, construcción y mantenimiento de la canalización de extremo a extremo, arquitectura y diseño que alimentan nuestro almacén de datos, aplicaciones basadas en modelos de lenguaje grandes (LLM) y BI basada en IA. **¡Si estás buscando una empresa que te ofrezca la máxima flexibilidad para elegir tu ubicación de trabajo, esta oportunidad es para ti!** ### **Responsabilidades:** * Diseñar, desarrollar y mantener tuberías de datos escalables para soportar la ingesta, transformación y entrega en almacenes centrales de características, flujos de entrenamiento de modelos y servicios de inferencia en tiempo real. * Construir y optimizar flujos de trabajo para extraer, almacenar y recuperar representaciones semánticas de datos no estructurados, permitiendo patrones avanzados de búsqueda y recuperación. * Diseñar e implementar soluciones ligeras de análisis y tableros que ofrezcan experiencias de consulta en lenguaje natural y conocimientos respaldados por IA. * Definir y ejecutar procesos para gestionar técnicas de ingeniería de indicaciones (prompt engineering), flujos de orquestación y rutinas de ajuste fino de modelos para impulsar interfaces conversacionales. * Supervisar almacenes de datos vectoriales y desarrollar metodologías eficientes de indexación para soportar flujos de trabajo de generación aumentada por recuperación (RAG). * Colaborar con interesados en los datos para recopilar requisitos sobre iniciativas de modelos de lenguaje y traducirlos en soluciones escalables. * Crear y mantener documentación completa de todos los procesos de datos, flujos de trabajo y rutinas de despliegue de modelos. * Debe estar dispuesto a mantenerse informado y aprender nuevas metodologías emergentes en ingeniería de datos, MLOps y operaciones de LLM. ### **Requisitos:** * 8 o más años de experiencia como Ingeniero de Datos, con al menos 2 años enfocados en MLOps. * Excelentes habilidades comunicativas en inglés. * Habilidades efectivas de comunicación oral y escrita con el equipo de BI y la comunidad de usuarios. * Experiencia demostrada utilizando Python para tareas de ingeniería de datos, incluyendo transformación, manipulación avanzada de datos y procesamiento de datos a gran escala. * Comprensión profunda de bases de datos vectoriales y arquitecturas RAG, y cómo impulsan flujos de trabajo de recuperación semántica. * Habilidad para integrar frameworks de LLM de código abierto en flujos de trabajo de ingeniería de datos para entrenamiento end-to-end, personalización y inferencia escalable. * Experiencia con plataformas en la nube como AWS o Azure Machine Learning para despliegues administrados de LLM. * Experiencia práctica con tecnologías de big data como Apache Spark, Hadoop y Kafka para procesamiento distribuido e ingesta de datos en tiempo real. * Experiencia diseñando tuberías de datos complejas que extraigan datos de fuentes RDBMS, JSON, API y archivos planos. * Habilidades demostradas en programación SQL y PLSQL, con dominio avanzado en metodologías de Business Intelligence y almacenes de datos, junto con experiencia práctica en uno o más sistemas de bases de datos relacionales y servicios de bases de datos en la nube como Snowflake/Redshift. * Comprensión de principios de ingeniería de software y experiencia trabajando en sistemas operativos Unix/Linux/Windows, así como experiencia con metodologías ágiles. * Dominio de sistemas de control de versiones, con experiencia en la gestión de repositorios de código, ramificación, fusión y colaboración en entornos de desarrollo distribuidos. * Interés en las operaciones empresariales y comprensión integral de cómo los sistemas robustos de BI impulsan la rentabilidad corporativa mediante la toma de decisiones basadas en datos y conocimientos estratégicos. ### **Atributos Deseables** * Experiencia con bases de datos vectoriales como DataStax AstraDB, y desarrollo de aplicaciones impulsadas por LLM usando frameworks populares de código abierto como LangChain y LlamaIndex, incluyendo ingeniería de indicaciones (prompt engineering), generación aumentada por recuperación (RAG) y orquestación de flujos de trabajo inteligentes. * Conocimiento sobre evaluación e integración de frameworks de LLM de código abierto, como Hugging Face Transformers/LLaMA-4 en flujos de trabajo completos, incluyendo ajuste fino y optimización de inferencia. * Conocimientos sobre herramientas de MLOps y tuberías CI/CD para gestionar el versionado de modelos y despliegues automatizados. **Por favor adjunte su CV en inglés.** El proceso de entrevista se realizará en inglés. **Solo aceptamos candidatos de LATAM.**


