Olá, mundo

Lucas Castro
Data Engineer

Data Engineer & ML Engineer Sênior no F1rst Santander. Construo pipelines de dados, arquiteturas analíticas em Azure Databricks e modelos de machine learning em produção.

📍 São Paulo, SP 🔧 Python · Spark · Scala 🤖 MLflow · Databricks

O que faço

Da ingestão de dados à geração de valor com modelos de ML.

⚙️

Engenharia de Dados

Pipelines ETL/ELT, streaming em tempo real e big data em ambientes on-premise e cloud. Mais de 4 anos no setor financeiro (Santander).

Apache Spark Kafka NiFi Hadoop Airflow
🤖

Machine Learning

Migração, treinamento e deployment de modelos em produção. Especialista em Azure Databricks e tracking de experimentos com MLflow.

scikit-learn PyTorch TensorFlow MLflow Databricks
☁️

Cloud & Infraestrutura

Arquiteturas de dados em Azure com Databricks, orquestração de workflows e infraestrutura como código.

Azure Docker OpenShift Terraform Kedro

Projetos em Destaque

Alguns projetos que demonstram minha atuação em dados e ML.

Pipeline de Dados em Tempo Real

Ingestão e processamento de streams com Kafka e Spark Streaming, com dados entregues em um warehouse analítico no S3.

Modelo de Previsão de Churn

Modelo de classificação com feature engineering avançado e tracking de experimentos com MLflow, servido via API REST.

Data Warehouse com dbt

Modelagem dimensional em camadas (Bronze/Silver/Gold) com dbt, testes automatizados e documentação gerada automaticamente.

Vamos conversar?

Aberto a oportunidades em engenharia de dados, projetos de ML e colaborações técnicas.