- Formação Ciência da Computação, Engenharia da Computação, Sistemas de Informação ou áreas correlatas.
- Conhecimento sólido em arquitetura de dados, modelagem de dados e conhecimento em linguagens de programação como Python, Scala e SQL.
- Familiaridade com tecnologias de armazenamento em nuvem, como AWS, Google Cloud Platform ou Microsoft Azure.
- Gestão de Dados: compreensão dos conceitos de gerenciamento de dados, modelagem de dados, bancos de dados relacionais e não relacionais, bem como ferramentas e tecnologias associadas.
- Inglês intermediário para avançado (necessário devido reuniões globais)
- Projetar e implementar a arquitetura do DataLake, garantindo a integração de fontes de dados diversas e a escalabilidade do sistema.
- Desenvolver pipelines de dados robustos para a ingestão, processamento e armazenamento de grandes volumes de dados de forma eficiente e segura.
- Colaborar com equipes de cientistas de dados e analistas para entender e atender às necessidades de dados da organização, garantindo a entrega das informações necessárias.
- Implementar práticas de governança de dados para assegurar a qualidade, segurança e conformidade dos dados armazenados no DataLake.
- Monitorar e otimizar o desempenho do DataLake, identificando e resolvendo problemas de integridade, desempenho ou segurança dos dados.
- Realizar a manutenção do DataLake, implementando melhorias e atualizações contínuas para garantir a eficiência e qualidade dos dados.
- Desenvolver e executar planos de recuperação de desastres para garantir a continuidade das operações em caso de falhas no sistema.
Implementar e gerir um ambiente de dados centralizado e eficiente que atenda às necessidades de coleta, processamento, análise e visualização de dados da organização. A principal missão é garantir que o DataLake seja uma fonte confiável e escalável de informações para apoiar as decisões estratégicas da empresa.