Cientista de dados
EnvironBIT
Regime de contratação
Não Informado
Modelo de trabalho
Não Informado
Carga horária
Não Informado
Descrição
CIENTISTA DE DADOS - MODELAGEM ESPACIAL DE CRÉDITOS DE BIODIVERSIDADE
OBRIGATÓRIO: Você deve preencher o formulário disponível no link abaixo
SOMENTE SERÃO AVALIADOS(AS) CANDIDATOS(AS) QUE ENVIAREM SUAS INFORMAÇÕES NESTE NO LINK INFORMADO
CONTRATAÇÃO
Tipo de Bolsa : Bolsa de Desenvolvimento Tecnológico DT-I — R$ 5.200,00 (Valores fixos conforme edital FAPEMIG; sem negociação.
Contratação como pessoa física, sem vínculo CLT, MEI ou PJ.)
Local de Trabalho 100 % home-office, obrigatoriamente residente em Minas Gerais
Formação : doutorado ou graduação e experiência equivalente (≥6 anos) em ciência de dados, modelagem espacial de dados ambientais ou áreas correlatas.
IMPORTANTE : Estes requisitos são exigência da FAPEMIG, não sendo possível alterar qualquer ponto.
OBJETIVOS
A EnvironBIT desenvolve a metodologia Km de Proteção (KmP) para identificar trechos rodoviários com alto risco de atropelamentos. Os KmP são modelos preditivos definidos km a km que integram dados de atropelamento, variáveis biológicas/ecológicas e tipologias de rodovias, permitindo mapear mais de 400 mil km com 86 % de precisão sem precisar estudar cada trecho. Esses modelos substituem estudos de campo longos e custosos e entregam risco por horário do dia, consideram sazonalidade e avaliam o comportamento do motorista (redução de velocidade). A empresa ampliou essa abordagem para criar os Créditos de Fauna (CF) . Inspirados nos créditos de carbono, os CF quantificam quantas vidas animais são preservadas quando motoristas reduzem a velocidade em trechos de risco; a quantidade de créditos depende do nível de risco do Km percorrido e da velocidade do veículo em relação ao limite da via.
O profissional desta vaga liderará o desenvolvimento do algoritmo que calcula os Créditos de Fauna , integrando os modelos KmP com variáveis de comportamento do motorista . O algoritmo deve seguir padrões de medição, reporte e verificação (MRV) compatíveis com certificações internacionais e possibilitar tokenização dos créditos no futuro.
RESPONSABILIDADES
Mês 1 – Imersão e Planejamento- Realizar imersão em Créditos de Fauna e Km de Proteção , consultando literatura científica, legislação de créditos de biodiversidade, reuniões com equipe interna e documentos internos da EnvironBIT. Compreender a relação entre risco, velocidade e vidas salvas.
- Mapear fontes de dados geoespaciais e de tráfego: bases de atropelamentos, dados de volume e velocidade (sistemas U‑Safe, telemetria de frotas, APIs de trânsito), limites de velocidade e características das vias.
- Documentar pipeline de ingestão de dados e cronograma de entrega.
- Aprender sobre nosso data warehouse geoespacial integrando KmP (variáveis de risco), dados de tráfego e telemetria (velocidade do veículo) e limites de velocidade.
- Desenvolver protótipo (v0.5) do algoritmo de Créditos de Fauna utilizando Python e bibliotecas como Pandas, NumPy, Scikit‑Learn, GeoPandas e PostGIS. O algoritmo deve calcular créditos ponderando o risco de cada quilômetro (KmP) e a mudança de comportamento dos motoristas.
- Definir métricas preliminares de performance (AUC, R²) e validar com dados históricos.
- Otimizar o algoritmo para atingir ≥80 % da meta de desempenho e cobrir ≥80 % do código com testes automatizados.
- Desenvolver pipeline MRV reprodutível, incluindo ETL transparente e logs para auditoria externa. Garantir compatibilidade com requisitos de certificação de créditos ambientais.
- Estabilizar o algoritmo (v1.0) e criar API REST para integração com o SaaS da EnvironBIT e sistemas de frotas.
- Empacotar a solução em container (Docker) e implementar CI/CD para deploy automatizado.
- Integrar novos fluxos de dados: condições climáticas, dados de fauna (espécies sensíveis), densidade de tráfego e ocupação das vias. Testar abordagens de aprendizado de máquina avançadas (modelos de séries temporais, redes neurais geoespaciais) para melhorar a precisão.
- Trabalhar com a equipe de produtos para definir requisitos de tokenização dos Créditos de Fauna , explorando padrões de blockchain e contratos inteligentes.
- Conduzir tests de estresse para avaliar robustez sob diferentes cenários (tráfego intenso, variação de limites de velocidade, diferentes biomas). Comparar o algoritmo com abordagens de referência.
- Produzir manual técnico detalhado, realizar workshop interno e transferir conhecimento para equipes de engenharia, ecologia e negócios.
REQUISITOS ESSENCIAIS
- Modelagem preditiva e análise geoespacial : mínimo de 3 anos de experiência em machine learning, preferencialmente em projetos envolvendo análise de risco ou impacto ambiental. Familiaridade com estatística espacial e algoritmos de regressão/classificação.
- Geoprocessamento e GIS : expertise em GeoPandas, PostGIS, QGIS e manipulação de dados vetoriais/rasters. Capacidade de integrar dados de tráfego e mapas de risco.
- Programação avançada em Python (Pandas, NumPy, Scikit‑Learn, PyTorch/TensorFlow opcional) e bancos de dados SQL/NoSQL.
- Dados de tráfego e telemetria : experiência com ingestão e tratamento de dados de velocidade de veículos, limites de vias, volume de tráfego e rotas.
- APIs e DevOps : construção de APIs REST, containerização (Docker), versionamento, testes automatizados e ferramentas de CI/CD.
- Idioma : inglês técnico para leitura de papers e documentação.
- Residência : Minas Gerais (trabalho 100 % remoto) com internet estável; sem vínculo CLT, MEI ou PJ.
SOFT SKILLS
- Rigor analítico e pensamento crítico para questionar suposições, identificar viés e assegurar a validade científica do algoritmo.
- Comunicação interdisciplinar para trabalhar com ecólogos, engenheiros de trânsito, cientistas de dados e gestores públicos.
- Proatividade para propor novas metodologias e otimizar pipelines; capacidade de aprendizado contínuo.
- Visão sistêmica voltada para sustentabilidade e ESG, entendendo o impacto social e ambiental dos Créditos de Fauna e seu potencial de tokenização.