Sobre Mim

Meu nome é Erick Gomes, sou mestre em Física Computacional pela Universidade Federal Fluminense (UFF), com sólida experiência em Ciência de Dados e Engenharia de Machine Learning. Atuo como Cientista de Dados Sênior, com forte domínio em projetos de alto impacto, liderando iniciativas de MLOps, engenharia de dados e desenvolvimento de soluções de IA para negócios. Minha trajetória inclui atuação estratégica no mercado financeiro, desenvolvimento de pipelines robustos, implantação de modelos de machine learning em produção e liderança técnica de times multidisciplinares.

Tenho expertise em aplicar algoritmos avançados de machine learning no contexto da física de materiais e em ambientes corporativos, além de experiência consolidada em integração de soluções com plataformas em nuvem, automação de processos e gestão de projetos de dados. Estou sempre em busca de aprimorar minhas habilidades e entregar resultados de alto valor para as organizações.

Atualmente, desempenho a função de Cientista de Dados Sênior no Mercado Financeiro, focando no desenvolvimento de soluções inovadoras com base nos dados do Open Finance.

Experiências

Cientista de Dados | Engenheiro de Machine Learning (MLOps) - Mobi2buy

Período: Abril 2024 - atualmente

Localização: São Paulo, Brasil (Trabalho Remoto)

  • Responsável pelo pipeline de ingestão de dados da esteira de MLOps utilizando AWS (S3, Glue, Athena, EC2).
  • Desenvolvimento e refatoração de códigos Python para integração com AWS via SDK.
  • Responsável pelo pipeline de MLOps utilizando MLflow, DVC, Github Actions, Evidentlyai, EC2, Airflow, Prometheus, Grafana e Terraform.
  • Responsável pela construção de modelos de machine learning, implantação e manutenção:
    • Construção de modelo de propensão para squad de cobrança.
    • Construção de modelo de previsão de vendas.
    • Construção de modelo de previsão de churn.
  • Responsável pela construção e manutenção de pipelines de engenharia de dados usando AWS (Glue, Lambda, Redshift):
    • Consumo de banco de dados transacional (OLTP) para ambiente analítico (OLAP).
    • Consumo de dados de API (REST e GraphQL) para ambiente analítico.
  • Construção de Chatbots utilizando IA generativa, Langchain, Vertex AI (Agent Builder):
    • Utilização do Langchain para integrar com diversos modelos de GenAI.
    • Utilização do Langchain para construir Retrieval Augmented Generation (RAG).
    • Utilização do Langchain, CrewAI, AutoGen e Langflow para construção de AI Agents.
    • Construção de sistemas com múltiplos agentes de IA.
    • Monitoramento de agentes.
    • Desenvolvimento de agentes para Visão Computacional.
  • Responsável pela gestão do backlog do time e condução das cerimônias do Scrum.

Cientista de Dados - Klavi

Período: agosto de 2023 - Abril 2024

Localização: São Paulo, Brasil (Trabalho Híbrido)

  • Construção de modelos de Churn para clientes de Instituições Financeiras.
  • Experiência com construção de dashboards utilizando Power BI.
  • Automatização de processos e construção de pipeline ETL (Extração, Transformação e Carga) para criação de tabelas consumidas por outras áreas.
  • Extração de Dados estruturados e não estruturados de diferentes fontes.
  • Utilização da linguagem Python para construção de projetos de aprendizado de máquina e análise de dados.

Cientista de Dados - Tecnologia Bancária (TecBan)

Período: julho de 2022 - julho de 2023

Localização: São Paulo, Brasil (Trabalho Remoto)

  • Análise de Dados e elaboração de provas de conceito com foco em informações financeiras.
  • Estruturação de dados para gerar insights estratégicos de negócio.
  • Estudo de tendências de mercado, especialmente no âmbito do Open Finance.
  • Emissão de relatórios para demandas específicas do setor de negócios.
  • Desenvolvimento de modelos preditivos para previsão de inadimplência e detecção de fraudes em pagamentos online.
  • Aplicação de técnicas de balanceamento de dados para aprimorar a qualidade dos modelos.
  • Avaliação de modelos de classificação utilizando métricas como AUC, Precisão, Revocação, F1-Score e AUPRC.
  • Desenvolvimento de APIs, implantação e deployment de modelos.

Principais Responsabilidades:

  • Construção da sandbox utilizando dados regulados do Open Finance.
  • Execução do pipeline ETL para carregar dados simulados no banco de dados.
  • Criação do copiloto de investimentos utilizando LLMs (Modelos de Linguagem de Grande Porte) e dados abertos do Open Finance.

Monitor de Pós-Graduação (Aprendizado de Máquina aplicado à Física) - Universidade Federal Fluminense

Período: julho de 2023 - dezembro de 2023

Como monitor da disciplina de Aprendizado de Máquina aplicado à Física, assumi um papel central na exploração e aplicação dos princípios fundamentais do aprendizado de máquina para resolver desafios específicos dentro do âmbito da física teórica e experimental.

Minha contribuição técnica envolveu orientar os alunos na implementação de algoritmos de aprendizado supervisionado e não supervisionado, como regressão, classificação, redes neurais e métodos de agrupamento, para analisar conjuntos de dados provenientes de fontes diversas.Através de linguagens e bibliotecas como Python, TensorFlow e scikit-learn, explorei métodos de pré-processamento de dados, seleção de características e otimização de modelos para extrair insights precisos e predições confiáveis.

Fui responsável pelas orientações semanais da disciplina de pós-graduação e auxílio na conclusão das atividades da disciplina.

Pesquisador de Mestrado | Pesquisador Ciência de Dados - Universidade Federal Fluminense

Período: março de 2022 - atualmente

Localização: Niterói, Rio de Janeiro, Brasil

Desenvolvendo minha pesquisa na área de aprendizado de máquina aplicado à Física, venho utilizando boas práticas da ciência de dados para propor novas soluções na análise de grandes bases de dados.

Principais Resultados:

  • Utilização de algoritmos de regressão para construir modelos preditivos com intuito de determinar energia de formação de materiais e, com isso, estabelecer um conjunto de materiais com estabilidade termodinâmica.
  • Utilização de algoritmos de classificação para construir modelo preditivo com intuito de separar materiais metálicos e isolantes.
  • Construção de modelo de regressão para fazer a predição de diversas propriedades de materiais isolantes.

3+ anos Como Pesquisador de Iniciação Científica | Pesquisador Ciência de Dados

Durante a iniciação científica pude desenvolver minhas habilidades em diversas ferramentas computacionas como programação em shell script, computação paralela e sistemas linux. Durante o projeto fui responsável por fazer estudos relacionados a física de materiais através de simulação computacional, área de estudo que envolve a produção de uma grande quantidade de dados para serem analisados.

2+ anos Desenvolvendo projeto de extensão universitária

Durante o projeto de extensão, utilizei sistemas embarcados como, Arduino e ESP32, para produzir experimentos de física. Fui resposável ainda por coordenar/orientar um grupo de alunos de graduação para produzir outros experimentos similares.

2 anos de Técnico em Eletroeletrônica

Durante o curso técnico em eletroeletrônica pude aprender sobre sistemas e componetes eletrônicos, o que me possibilitou, posteriormente, a desenvolver projetos em análise de dados de circuitos eletrônicos e de sistemas embarcados.

Habilidades

Linguagens de Programação, Banco de Dados e Sistema Operacional

  • Linguagem de Programação: Python (Pandas, Numpy, Scikit-learn).
  • Programação C e C++.
  • SQL, MySQL, MongoDB e PostgreSQL.
  • +10 anos usando Linux (diferentes distribuições).

IA, Machine Learning e Estatística

  • Microsoft Azure Machine Learning
  • Estatística Descritiva (localização, dispersão, assimetria, kurtosis, densidade ).
  • Estatística Inferencial.
  • Algoritmos de Regressão, Classificação, Clusterização, Regras de Associação e Padrões Sequenciais.
  • MLflow

Visualização de Dados

  • Microsoft PowerBI e Tableau.
  • Matplotlib,Seaborn e Plotly.
  • Streamlit.

Engenharia de Software

  • Git, Github, Linux.
  • Construção de API com Flask, Postman API.

Cloud, MLOps e Engenharia de Dados

  • AWS (S3, Glue, Athena, EC2, Lambda, Redshift)
  • MLflow, DVC, Github Actions, Evidentlyai
  • Airflow, Prometheus, Grafana, Terraform
  • Integração Python com AWS via SDK
  • Construção e manutenção de pipelines de dados e MLOps

IA Generativa e Chatbots

  • Langchain, Vertex AI (Agent Builder), CrewAI, AutoGen, Langflow
  • Construção de sistemas RAG (Retrieval Augmented Generation)
  • Desenvolvimento e monitoramento de múltiplos agentes de IA
  • Agentes para Visão Computacional

Projetos de Ciência de Dados

Rossmann - Previsão de Vendas

Objetivo:

Construir um modelo para fazer previsão de vendas da rede de farmácias Rossmann.

Ferramentas Utilizadas:

  • Sistema Operacional: Linux.
  • IDE: Jupyter Notebook
  • Liguagem de programação: Python.
  • Frameworks e Bibliotecas: Scikit-learn, Pandas, Numpy, Scipy, Matplotlib, Seaborn, Flask.
  • Algoritmos Utilizados: Linear Regressor, LASSO, Random Forest e XGBoost Regressor.
  • Versionamento de Código: Git/Github.
  • Deployment: Render Cloud.

Previsão de Inadimplência e Score de Crédito

Objetivo:

Construir um modelo para fazer previsão de inadimplência no cartão de crédito.

Ferramentas Utilizadas:

  • Sistema Operacional: Linux.
  • IDE: Jupyter Notebook
  • Liguagem de programação: Python.
  • Frameworks e Bibliotecas: Scikit-learn, Pandas, Numpy, Scipy, Matplotlib, Seaborn e Imbalanced-learn.
  • Algoritmos Utilizados: KNN, Decision Tree Classifier, Random Forest Classifier, Regressão Logística e XGBoost Classifier.
  • Técnicas de balanceamento: Oversampling - SMOTE e ADASYN | Undersampling - Random Undersampling(RUS).
  • Métricas de Avaliação: Precision, Recall, F1-Score, Area Under Curve(AUC) e Area Under Precision-Recall Curve(AUPRC).
  • Versionamento de Código: Git/Github.
  • WebApp: Streamlit.
  • Deployment: Render Cloud.

1° Lugar Artigo Inovador - Prêmio IEL de Talentos

Open Finance e Inteligência Artificial: A União Entre Finanças e Tecnologia

Objetivo:

Este artigo explora a sinergia entre Open Finance e Inteligência Artificial (IA) e seu impacto na indústria financeira. Analisamos o conceito do open finance, que engloba a abertura de dados e serviços financeiros através de APIs (interfaces de programação de aplicativos), e a aplicação da IA nesse contexto. Discutimos os benefícios do open finance, como maior inclusão financeira e inovação, e destacamos como a IA pode ser utilizada para aprimorar a análise de dados e a personalização de serviços financeiros. Concluímos que a combinação de open finance e IA tem o potencial de transformar a forma como nos relacionamos com as finanças, proporcionando uma experiência mais eficiente, conveniente e personalizada.

Contato

Sinta-se à vontade para entrar em contato.