




Esta es una oportunidad a tiempo completo para trabajar desde casa para un destacado **Ingeniero de Datos/Aprendizaje Automático de América Latina.** IDT (www.idt.net) es una empresa estadounidense de telecomunicaciones fundada en 1990 con sede en Nueva Jersey. Hoy es líder en la industria de servicios de comunicación y pago prepagos, y uno de los mayores proveedores mundiales de voz internacional. Estamos cotizados en la Bolsa de Nueva York, empleamos a más de 1300 personas en más de 20 países y tenemos ingresos superiores a 1500 millones de dólares. Estamos buscando un Ingeniero de Datos/Aprendizaje Automático experimentado para unirse a nuestro equipo de BI y desempeñar un papel activo en el diseño, construcción y mantenimiento de la tubería de datos, arquitectura y diseño de extremo a extremo que alimenta nuestro almacén de datos, aplicaciones basadas en modelos de lenguaje grandes (LLM) y BI basado en IA. **¡Si buscas una empresa que te ofrezca la máxima flexibilidad para elegir dónde trabajar, esta oportunidad es para ti!** ### **Responsabilidades:** * Diseñar, desarrollar y mantener tuberías de datos escalables para soportar la ingesta, transformación y entrega en almacenes centrales de características, flujos de entrenamiento de modelos y servicios de inferencia en tiempo real. * Crear y optimizar flujos de trabajo para extraer, almacenar y recuperar representaciones semánticas de datos no estructurados, permitiendo patrones avanzados de búsqueda y recuperación. * Diseñar e implementar soluciones ligeras de análisis y tableros de control que ofrezcan experiencias de consulta en lenguaje natural y conocimientos respaldados por IA. * Definir y ejecutar procesos para gestionar técnicas de ingeniería de indicaciones (prompt engineering), flujos de orquestación y rutinas de ajuste fino de modelos para impulsar interfaces conversacionales. * Supervisar almacenes de datos vectoriales y desarrollar metodologías eficientes de indexación para soportar flujos de trabajo de generación aumentada por recuperación (RAG). * Colaborar con las partes interesadas en datos para recopilar requisitos sobre iniciativas de modelos de lenguaje y traducirlos en soluciones escalables. * Crear y mantener documentación completa de todos los procesos de datos, flujos de trabajo y rutinas de despliegue de modelos. * Debe estar dispuesto a mantenerse informado y aprender nuevas metodologías emergentes en ingeniería de datos, MLOps y operaciones de LLM. ### **Requisitos:** * 8 o más años de experiencia como Ingeniero de Datos, con al menos 2 años enfocados en MLOps. * Excelentes habilidades comunicativas en inglés. * Habilidades efectivas de comunicación oral y escrita con el equipo de BI y la comunidad de usuarios. * Experiencia demostrada utilizando Python para tareas de ingeniería de datos, incluyendo transformación, manipulación avanzada de datos y procesamiento de grandes volúmenes de datos. * Comprensión profunda de bases de datos vectoriales y arquitecturas RAG, y cómo impulsan flujos de trabajo de recuperación semántica. * Habilidad para integrar frameworks de LLM de código abierto en flujos de trabajo de ingeniería de datos para entrenamiento, personalización e inferencia escalable de extremo a extremo. * Experiencia con plataformas en la nube como AWS o Azure Machine Learning para despliegues gestionados de LLM. * Experiencia práctica con tecnologías de big data, incluyendo Apache Spark, Hadoop y Kafka, para procesamiento distribuido e ingesta de datos en tiempo real. * Experiencia diseñando tuberías de datos complejas que extraigan información de fuentes RDBMS, JSON, API y archivos planos. * Habilidades demostradas en programación SQL y PLSQL, dominio avanzado en metodologías de Business Intelligence y almacenes de datos, junto con experiencia práctica en uno o más sistemas de bases de datos relacionales y servicios de bases de datos en la nube como Snowflake/Redshift. * Conocimiento de principios de ingeniería de software y experiencia trabajando en sistemas operativos Unix/Linux/Windows, así como experiencia con metodologías ágiles. * Dominio de sistemas de control de versiones, con experiencia en la gestión de repositorios de código, ramificación, fusión y colaboración en entornos de desarrollo distribuidos. * Interés en las operaciones empresariales y comprensión completa de cómo los sistemas robustos de BI impulsan la rentabilidad corporativa mediante la toma de decisiones basadas en datos y conocimientos estratégicos. ### **Aptitudes deseables** * Experiencia con bases de datos vectoriales como DataStax AstraDB, y desarrollo de aplicaciones impulsadas por LLM utilizando frameworks populares de código abierto como LangChain y LlamaIndex, incluyendo ingeniería de indicaciones (prompt engineering), generación aumentada por recuperación (RAG) y orquestación de flujos de trabajo inteligentes. * Familiaridad con la evaluación e integración de frameworks de LLM de código abierto, como Hugging Face Transformers/LLaMA-4 en flujos de trabajo completos, incluyendo ajuste fino y optimización de inferencia. * Conocimiento de herramientas MLOps y pipelines CI/CD para gestionar el versionado de modelos y despliegues automatizados. **Por favor adjunte su CV en inglés.** El proceso de entrevista se realizará en inglés. **Solo aceptamos candidatos de América Latina.** Podemos utilizar herramientas de inteligencia artificial (IA) para apoyar partes del proceso de contratación, como revisar solicitudes, analizar currículos o evaluar respuestas. Estas herramientas asisten a nuestro equipo de reclutamiento, pero no sustituyen el juicio humano. Las decisiones finales de contratación siempre las toman personas. Si desea obtener más información sobre cómo se procesan sus datos, contáctenos.


