Engenheiro de Dados

Mergen Partners Private Limited

₱200-230K[Mensual]
Remoto5-10 anos ExpBacharelTempo Inteiro
Compartilhar

Detalhes remotos

Abrir PaísFilipinas

Requisitos de IdiomaPortuguese-Brazil

Este trabalho remoto está aberto para candidatos em países específicos. Por favor, confirme se deseja continuar, apesar das restrições de localização.

Descrição do Trabalho

Mostrar texto original

Descrição:

Você É O(a) Candidato(a) Ideal?

Como Engenheiro(a) Líder Técnico - Dados, você irá projetar, implementar e escalar uma plataforma de dados de ponta a ponta construída na AWS S3, Glue, Lake Formation e DMS. Você liderará uma pequena equipe de engenheiros, enquanto colabora de forma cruzada com as partes interessadas de fraudes, finanças, produtos e engenharia para garantir acesso a dados confiáveis, oportunos e seguros em toda a empresa.

Você será um defensor das melhores práticas em design de dados, governança e observabilidade, aproveitando ferramentas de IA Generativa para aumentar a produtividade da engenharia e acelerar o tempo de obtenção de insights.


Você será um defensor das melhores práticas em design de dados, governança e observabilidade, aproveitando ferramentas de IA Generativa para aumentar a produtividade da engenharia e acelerar o tempo de obtenção de insights.


Você Contribuirá Para

  • Ser responsável pelo design e escalabilidade da arquitetura do lago de dados para cargas de trabalho de streaming e em batch, aproveitando serviços nativos da AWS.
  • Liderar o desenvolvimento de pipelines de ingestão, transformação e armazenamento usando AWS Glue, DMS, Kinesis/Kafka e PySpark.
  • Estruturar e evoluir dados em formatos de tabela abertos (Apache Iceberg, Delta Lake) para suportar consultas em tempo real e de viagem no tempo para serviços downstream.
  • Impulsionar a produtização de dados, permitindo acesso API-first e self-service a conjuntos de dados curados para casos de uso de detecção de fraudes, reconciliação e relatórios.
  • Definir e monitorar SLAs e SLOs para pipelines de dados críticos, garantindo alta disponibilidade e precisão dos dados em um ambiente fintech regulado.
  • Colaborar com as equipes de InfoSec, SRE e Governança de Dados para impor segurança de dados, rastreamento de linhagem, controle de acesso e conformidade (GDPR, MAS TRM).
  • Usar ferramentas de IA Generativa para aumentar a produtividade dos desenvolvedores, incluindo a geração automática de harnesses de teste, documentação de esquemas, estruturas de transformação e insights de desempenho.
  • Orientar engenheiros de dados, definindo a direção técnica e garantindo a entrega de pipelines de dados de alta qualidade e observáveis.


Responsabilidades

  • Projetar pipelines escaláveis e otimizados em custo, abrangendo paradigmas em tempo real e em batch, usando ferramentas como AWS Glue, Step Functions, Airflow ou EMR.
  • Gerenciar a ingestão de fontes transacionais usando AWS DMS, com foco no manuseio de desvios de esquema e replicação de baixa latência.
  • Projetar estratégias eficientes de particionamento, compressão e metadados para tabelas Iceberg ou Hudi armazenadas no S3, catalogadas com Glue e Lake Formation.
  • Construir data marts, views de auditoria e camadas analíticas para suportar processos orientados por máquina (por exemplo, motores de fraude) e interfaces legíveis por humanos (por exemplo, painéis).
  • Garantir robustez na observabilidade de dados com métricas, alertas e rastreamento de linhagem via OpenLineage ou Great Expectations.
  • Liderar revisões trimestrais de custo de dados, desempenho, evolução de esquemas e design de arquitetura com partes interessadas e liderança sênior.
  • Impor controle de versão, CI/CD e práticas de infraestrutura como código usando GitOps e ferramentas como Terraform.

Requisito

  • Pelo menos 7 anos de experiência em engenharia de dados.
  • Experiência prática profunda com o conjunto de dados da AWS: Glue (Jobs & Crawlers), S3, Athena, Lake Formation, DMS e Redshift Spectrum.
  • Especialização em projetar pipelines de dados para sistemas em tempo real, streaming e em lotes, incluindo design de schema, otimização de formatos e SLAs.
  • Fortes habilidades de programação em Python (PySpark) e SQL avançado para processamento analítico e transformação.
  • Experiência comprovada em gerenciar arquiteturas de dados utilizando formatos de tabela abertos (Iceberg, Delta Lake, Hudi) em grande escala.
  • Compreensão do processamento de streams com Kinesis/Kafka e orquestração via Airflow ou Step Functions.
  • Experiência na implementação de controles de acesso a dados, políticas de criptografia e fluxos de trabalho de conformidade em ambientes regulados.
  • Capacidade de integrar ferramentas de GenAI nos processos de engenharia de dados para promover ganhos mensuráveis de produtividade e qualidade — com forte higiene de engenharia.
  • Capacidade demonstrada de liderar equipes, tomar decisões arquitetônicas e colaborar com partes interessadas multifuncionais.

Pontos Extras

  • Experiência trabalhando em um ambiente regulado pelo PCI DSS ou qualquer outro banco central com requisitos de auditoria e retenção de dados.
  • Experiência no domínio de pagamentos ou bancário, com casos de uso em reconciliação, análise de chargeback ou detecção de fraudes.
  • Familiaridade com contratos de dados, padrões de malha de dados e princípios de dados como produto.
  • Experiência usando GenAI para automatizar a documentação de dados, gerar testes de dados ou apoiar casos de uso de reconciliação.
  • Exposição a estratégias de otimização de desempenho e redução de custos no AWS Glue, Athena e S3.
SQLPythonpysparkAWS DatastackGlueS3AthenaLake Formation
Preview

Jatin Kaushik

DirectorMergen Partners Private Limited

Ativo dentro de três dias

Postado em 26 June 2025

Bossjob Safety Reminder

If the position requires you to work overseas, please be vigilant and beware of fraud.

If you encounter an employer who has the following actions during your job search, please report it immediately

  • withholds your ID,
  • requires you to provide a guarantee or collects property,
  • forces you to invest or raise funds,
  • collects illicit benefits,
  • or other illegal situations.