Cientista de Dados
3AM IT Services
Nova
Publicada há 5 horas
Regime de contratação
Não Informado
Modelo de trabalho
Remoto
Carga horária
Não Informado
Descrição
CIENTISTA DE DADOS
- 100% remoto.
- Horário comercial - 8h às 17h ou 9h às 18h.
- Perfil Pleno.
Descrição da vaga:
- Realiza atividades no desenvolvimento de novos produtos e demandas para melhoria contínua das ferramentas:
- 1) SISMO®DEEPBLUE, desenvolvendo modelos hidrodinâmicos, meteorológicos e oceanográficos com aplicação de Machine Learning, para aplicação de Inteligência Artificial;
- 2) SISMOD, Desenvolvimento de script no para aprimorar a qualidade dos dados recebidos dos equipamentos, aplicando técnicas de controle de qualidade baseadas na norma QARTOD, conforme o manual global de controle de dados oceânicos da NOAA;
- Realizar atividades no desenvolvimento de novos produtos e demandas para a ferramenta SISMO®DEEPBLUE, através de coleta, análise de dados, criação da base de dados, desenvolvimento do modelo e validação;
- Solucionar problemas com dados oceanográficos utilizando Data Science;
- Auxiliar e dar suporte ao time na limpeza do Dataset e em Feature Engineering;
- Trabalhar em conjunto com o engenheiro de dados na criação de Datasets, no formato necessário para treinamento de múltiplos modelos de machine learning;
- Limpar, Analisar, organizar, integrar dados e ajudar na criação de pipelines de dados;
- Atuar em análises exploratórias e descritivas, bem como na modelagem preditiva, aplicando aprendizado de máquina;
- Aplicar melhorias contínuas dos modelos que compõem a ferramenta SISMO®DEEPBLUE;
- Analisar e aplicar melhorias na arquitetura de dados, com comunicação direta com os desenvolvedores e/ou Arquiteto de Dados;
- Liderar reuniões de apresentações orais e escritas, bem como relatórios sobre os resultados, para clientes, sócios e outros stakeholders;
- Desenvolver relatórios de análise de dados, performance da previsão e desenvolvimento dos modelos preditivos, direcionados aos clientes;
- Usar PCA para possíveis experimentos que envolvam redução de dimensionalidade.
- Usar notebooks como o Jupyter e/ou Google Colab;
- Desenvolver e melhorar modelos de IA para análise e previsão de séries temporais meteoceanográficas;
- Aplicar técnicas de processamento, qualidade e validação de dados (ex.: QARTOD/NOAA);
- Trabalhar em conjunto com oceanógrafos e engenheiros na interpretação dos resultados;
- Contribuir para a evolução da nossa plataforma de análise e visualização de dados.
Requisitos:
- Experiência em Ciências de dados, em análise de dados e séries temporais;
- Superior completo em Oceanografia, Meteorologia ou áreas correlatas. Especialização em Ciência de Dados;
- Redação de documentos técnicos;
- Inglês e espanhol avançado para leitura, escrita (manuais, documentos técnicos e e-mails) e conversação;
- Excel avançado (domínio de funções como PROCV e SE; tabela dinâmica e dashboards);
- Word intermediário (formatação, referência cruzada, índice);
- Experiência com análise exploratória de dados meteo-oceanográficos;
- Experiência no emprego de técnicas estatísticas e modelagem preditiva;
- Experiência com Data Cleaning & Prep e estatística Descritiva para análise inicial dos dados;
- Experiência em programação com utilização da linguagem Python 3.x e seus pacotes para análise de dados como por exemplo, Scikit-Learn, TensorFlow, Pandas, Numpy, dentre outras;
- Experiência em análise de dados com aplicação dos algoritmos de Deep Learning, estes essenciais para o projeto como MLP, LSTM, CNNs etc. com uso de Python;
- Experiência em análise e modelagem de séries temporais;
- Algoritmos árvores de Decisão, Random Forest, Regressões, KNN dentre outros, com uso de Python;
- Conhecimentos em Transfer Learning; · Conhecimento nas linguagens SQL, Shell scripts; ·
- Conhecimento em sistemas gerenciadores de dados;
- Conhecimento em validação e elaboração de documentos (emissão de relatórios direcionados a validação de produtos);
- Conhecimento em desenvolvimento e armazenamento cloud (Nuvem AWS);
- Experiência em ambiente em nuvem (Preferencial AWS) e Ferramentas de Big Data; · Conhecimento em arquitetura de dados;
- Otimização e Melhoria Contínua (otimizar algoritmos e processos, melhorando a eficiência e a precisão dos modelos).