




Resumen: Únase a un equipo remoto como Ingeniero Senior de Software de Datos para diseñar, desarrollar y mantener tuberías de datos utilizando Apache Spark y PySpark para una empresa farmacéutica y de dispositivos médicos. Aspectos destacados: 1. Desarrollar y mantener tuberías de datos y soluciones analíticas 2. Colaborar con equipos multifuncionales para comprender los requisitos empresariales 3. Optimizar trabajos de Spark para el rendimiento y la escalabilidad mediante servicios de AWS Únase a nuestro equipo **remoto** como **Ingeniero Senior de Software de Datos** y trabaje con una empresa farmacéutica y de dispositivos médicos suizo-estadounidense especializada en productos para el cuidado ocular. Con un enfoque en productos para el cuidado visual y quirúrgicos, esta empresa se compromete a mejorar la salud ocular en todo el mundo. Como Ingeniero Senior de Software de Datos, será responsable de diseñar, desarrollar y mantener tuberías de datos utilizando Apache Spark y PySpark. Colaborará con equipos multifuncionales para comprender los requisitos empresariales y traducirlos en soluciones técnicas, garantizando la seguridad de los datos y el cumplimiento de las políticas de gobernanza de datos. **Responsabilidades** * Desarrollar y mantener tuberías de datos y soluciones analíticas * Optimizar trabajos de Spark para el rendimiento y la escalabilidad, aprovechando servicios de AWS * Contribuir al desarrollo de la arquitectura de datos y la modelación de datos * Garantizar la precisión de los datos y el control de calidad mediante pruebas unitarias y tipos de archivo basados en columnas * Participar en revisiones de código y contribuir al desarrollo de mejores prácticas para la ingeniería de datos * Colaborar con equipos multifuncionales para comprender los requisitos empresariales y las necesidades de datos, contribuyendo al desarrollo de soluciones basadas en datos * Mantenerse actualizado sobre las últimas tecnologías y tendencias en ingeniería de datos **Requisitos** * Un mínimo de 3 años de experiencia en Ingeniería de Software de Datos, con un sólido conocimiento del dominio de los datos * Experiencia con Apache Spark y PySpark, así como con SQL y tecnologías de Big Data * Competencia en Amazon Web Services (AWS), incluidas AWS CLI, S3, Glue, Lambda, Athena y Step Functions * Conocimientos sobre tipos de archivo basados en columnas y pruebas unitarias * Excelentes habilidades comunicativas y una sólida capacidad de pensamiento crítico para transmitir eficazmente comentarios e ideas * Dominio fluido del inglés hablado y escrito a nivel intermedio-alto o superior, que permita una comunicación efectiva **Deseable** * Experiencia con herramientas de CI/CD como Atlassian Bitbucket, AWS CodeBuild y Terraform


