




Resumen: Ingeniero Líder de Datos para diseñar y entregar la infraestructura de datos central destinada a análisis impulsados por IA sobre datos de seguridad de redes, transformando registros complejos en bases de datos estructuradas y paneles interactivos de BI. Aspectos destacados: 1. Dirigir el diseño de la infraestructura de datos para análisis de seguridad de redes impulsados por IA 2. Desarrollar canalizaciones ETL robustas y bases de datos DynamoDB para registros de seguridad 3. Integrar AWS QuickSight para paneles interactivos de BI y conocimientos para las partes interesadas Nuestro cliente está desarrollando una capa analítica impulsada por IA sobre una plataforma de datos de seguridad de redes. Como **Ingeniero Líder de Datos** en este proyecto, usted diseñará y entregará la infraestructura de datos central orientada a derivar políticas de seguridad a partir de registros de redes de tecnología operacional. Trabajará con exportaciones de datos diversas y complejas procedentes de plataformas industriales de seguridad —como sistemas de monitoreo de redes— y las transformará en una base de datos DynamoDB bien estructurada. Una vez establecida la base de datos, la conectará con AWS QuickSight para ofrecer paneles interactivos de BI que brinden a las partes interesadas visibilidad inmediata del comportamiento de la red, los eventos de seguridad y las brechas en las políticas. **Responsabilidades** * Desarrollar y configurar bases de datos DynamoDB para servir como repositorio central de información de registros de redes y seguridad * Establecer diseños de tablas, claves de partición, claves de ordenación e índices secundarios globales para soportar datos de eventos a gran escala y en serie temporal * Mejorar la eficiencia de la base de datos y gestionar los costos mediante el uso de funciones de DynamoDB y la implementación de soluciones de archivado de datos * Construir canalizaciones ETL confiables para importar datos desde archivos Excel, CSV y fuentes API de sistemas de monitoreo de redes * Limpiar, validar, estandarizar y enriquecer los datos de eventos de seguridad, abordando inconsistencias de esquema y campos faltantes * Configurar orquestación automatizada, programación y manejo de errores para garantizar un funcionamiento constante de las canalizaciones y la disponibilidad oportuna de los datos * Integrar DynamoDB con AWS QuickSight para construir paneles y reportes interactivos que resalten eventos de seguridad y actividad de la red * Crear y actualizar conjuntos de datos de QuickSight, campos calculados y visualizaciones, perfeccionando los diseños de los paneles según las opiniones de las partes interesadas * Colaborar con especialistas en ciberseguridad, ingenieros de IA/analíticos, arquitectos de IA y otras partes interesadas para convertir necesidades empresariales en soluciones de arquitectura de datos * Preparar documentación técnica exhaustiva, incluidos diseños de esquemas, diccionarios de datos, detalles de canalizaciones y guías operativas **Requisitos** * Al menos 5 años de experiencia en puestos de ingeniería de datos * Un año mínimo de experiencia liderando y gestionando equipos de desarrollo * Conocimiento profundo de DynamoDB, incluido el diseño de tablas, estrategias de claves de partición y de ordenación, índices secundarios globales (GSIs), planificación de capacidad, Streams y modelado NoSQL para cargas de trabajo de alto volumen * Capacidad demostrada para construir canalizaciones ETL/ELT robustas en Python utilizando herramientas como boto3 y pandas, capaces de procesar datos fuente diversos y en múltiples formatos, y cargarlos en DynamoDB * Competencia en servicios de AWS como S3, Lambda, IAM y CloudWatch, y su integración con DynamoDB y QuickSight * Experiencia usando AWS QuickSight para desarrollar conjuntos de datos, análisis y paneles interactivos, conectándose a fuentes de datos de AWS y creando visualizaciones para una amplia audiencia * Competencia en modelado de datos NoSQL, diseñando estructuras desnormalizadas orientadas a consultas para datos clave-valor y orientados a documentos * Base sólida en ingeniería de calidad de datos, incluidos marcos de validación, contratos de datos y pruebas automatizadas de canalizaciones * Habilidades avanzadas en Python para escribir código ETL mantenible, con familiaridad en entornos virtuales, pruebas y control de versiones mediante Git * Capacidad para documentar claramente las decisiones técnicas y colaborar eficazmente con partes interesadas no técnicas * Excelentes habilidades de comunicación en inglés, nivel B2+ o superior, tanto escritas como habladas **Deseable** * Experiencia con AWS Glue y Athena para ETL sin servidor y consulta de lagos de datos basados en S3 * Conocimiento de bases de datos de grafos como Neo4j o Amazon Neptune y modelado de datos como nodos y relaciones para representar topologías de red y políticas * Familiaridad con herramientas de CI/CD como GitHub Actions o GitLab CI para pruebas y despliegues automatizados de canalizaciones * Experiencia previa con registros de seguridad de redes, análisis de ciberseguridad o entornos centrados en la seguridad * Comprensión de la minería de procesos, incluidas las estructuras de registros de eventos y su uso en algoritmos de minería de procesos * Experiencia con herramientas o metodologías de desarrollo asistidas por IA


