Sobre mim:
Sou um Engenheiro de Dados experiente com 5 anos de experiência construindo soluções de dados robustas em diversas indústrias. Com formação em engenharia mecânica e treinamento especializado em ciência de dados, trago uma perspectiva analítica única para cada projeto.
Me especializo em projetar e implementar pipelines de dados end-to-end que transformam informações brutas em inteligência de negócios acionável. Minha expertise abrange arquitetura moderna de dados, infraestrutura em nuvem e sistemas de processamento distribuído.
Meu conjunto de ferramentas técnicas inclui:
- Desenvolvimento de pipelines de dados usando Python e SQL.
- Implementação de plataformas em nuvem (AWS, Google Cloud, Huawei Cloud).
- Processamento de big data com Apache Spark e sistemas distribuídos.
- Orquestração de contêineres com Docker e Kubernetes.
- Design e otimização de fluxos de trabalho ETL/ELT.
- Arquitetura orientada a eventos com Kafka e RabbitMQ.
- Infraestrutura como código com Terraform.
- Modelagem de dados e design de esquemas.
Prospero na resolução de desafios complexos de dados com soluções elegantes e escaláveis. Minha abordagem combina precisão técnica com visão de negócios, garantindo que a infraestrutura de dados atenda aos objetivos estratégicos.
O que me diferencia é minha capacidade de:
- Projetar sistemas modulares e de fácil manutenção que se adaptam a requisitos em mudança.
- Otimizar o desempenho através de arquitetura bem pensada e alocação de recursos.
- Implementar melhores práticas para governança e segurança de dados.
Resumo da experiência profissional:
Sou Pedro Augusto de Lima e Silva, Engenheiro de Dados baseado em Curitiba, Brasil. Formei-me em Engenharia Mecânica pela UFPR (2014-2019) e possuo especialização em Ciência de Dados e suas Aplicações pela UTFPR (2021-2022). Sou apaixonado por programação, e meu amor por jogos e meu lado "nerd" me tornam naturalmente curioso e ávido por aprender. Prospero diante de desafios e estou sempre buscando soluções para melhorar o desempenho dos negócios.
Atualmente estou no Bradesco como Engenheiro de Dados, atuando principalmente com pipelines de dados com o Databricks.
Trabalhei como Engenheiro de Dados na Neogrid (desde fevereiro de 2023), onde desenvolvi um projeto de ingestão de dados capaz de consumir múltiplos formatos usando Python e orquestrado por MAGE.AI. Implementei uma arquitetura orientada a eventos utilizando ferramentas de mensageria como Kafka e RabbitMQ, desenvolvi modelos de dados em Postgres, e integrei Spark e DuckDB para processamento distribuído. Também desenvolvi processos que garantiram integração e implementação contínuas com escalabilidade e segurança, utilizando recursos de gerenciamento de segredos de provedores como Azure e HUAWEI Cloud.
Anteriormente, trabalhei como Engenheiro de Dados na Gamers Club (junho/2023 - janeiro/2024), onde adquiri experiência com dados não-relacionais, incluindo bancos de dados como MongoDB e Cassandra, e operações com Apache Spark. Implementei técnicas de modelagem de dados, otimizações de desempenho, e trabalhei com infraestrutura como código para criar, escalar e manter serviços essenciais de arquitetura usando Terraform, com experiência em recursos de nuvem como EC2, S3, DMS, entre outros.
Também atuei como Analista de Dados na Gamers Club (julho/2021 - maio/2023), utilizando SQL para extrair informações de bancos de dados MySQL e PostgreSQL, além de manipulação de dados com Apache Spark. Construí pipelines usando Python, Databricks e Airflow, colaborei na definição de métricas-chave para avaliar a saúde e o desempenho do negócio, e criei modelos de classificação e regressão.
Minha experiência anterior inclui o cargo de Analista de Dados na James Delivery (maio/2020 - junho/2021), onde criei análises para fornecer insights valiosos para diferentes áreas de negócio, conduzi estudos de comportamento do cliente, e desenvolvi rotinas ETL em Python, criando e mantendo pipelines em Airflow.
Possuo conhecimentos em SQL, Python, Databricks, Docker, Spark, ETL, ELT, Kubernetes, Git, desenvolvimento de API, Big Data, AWS, Huawei Cloud, Google Cloud e Machine Learning. Falo português nativo e inglês avançado, e recentemente participei do AWS Data Engineering Bootcamp (2023) e de um curso sobre Testes e Monitoramento de Modelos de Machine Learning (2022).