




Resumen: Buscamos un Ingeniero Senior de Big Data remoto experimentado y apasionado por los datos para desarrollar, supervisar y operar canalizaciones de datos curados, volver a desarrollar sistemas heredados y asesorar a científicos de datos. Aspectos destacados: 1. Desarrollar, supervisar y operar canalizaciones de datos curados críticas 2. Volver a desarrollar canalizaciones heredadas en versiones avanzadas y escalables 3. Aprovechar y mejorar una pila tecnológica basada en la nube Buscamos un **Ingeniero Senior de Big Data remoto** experimentado y apasionado por los datos para desarrollar, supervisar y operar la canalización de datos curados de nuestro proyecto. El candidato ideal tiene una sólida formación en Ingeniería de Software de Datos y amplia experiencia con DSE, Python, AWS, Databricks y SQL. En este puesto, será responsable de volver a desarrollar canalizaciones heredadas en versiones nuevas, avanzadas y escalables, asesorar a científicos de datos y gerentes de producto, construir y mejorar indicadores clave de rendimiento (KPI) y mantener nuestra pila tecnológica basada en la nube. **Responsabilidades** * Desarrollar, supervisar y operar la canalización de datos curados más crítica del proyecto * Asesorar a científicos de datos y gerentes de producto para mejorar los KPI destinados a la dirección estratégica empresarial * Volver a desarrollar canalizaciones heredadas en versiones avanzadas y escalables, fáciles de mantener * Aprovechar y mejorar nuestra pila tecnológica basada en la nube, que incluye AWS, Databricks, Kubernetes, Spark, Airflow, Python y Scala * Construir, supervisar y mantener canalizaciones de Apache Airflow **Requisitos** * Mínimo 3 años de experiencia en Ingeniería de Software de Datos * Conocimientos expertos en Apache Spark, Spark Streaming y Databricks * Dominio del lenguaje de programación Scala y de SQL * Experiencia trabajando con el entorno AWS y Github * Capacidad para construir canalizaciones de Apache Airflow * Nivel de inglés B2+ **Deseable** * Conocimientos de Presto, Superset y Starburst * Experiencia con Oracle y Exasol


