[ANATEL] Cientista De Dados Pleno
First Decision
Inscrições até 28/02/26
Regime de contratação
CLT
Modelo de trabalho
Não Informado
Carga horária
40 horas semanais
Benefícios
- plano de saude
- Plano Odontológico
- Vale Refeição
- Vale Alimentação
- outros
Descrição
Desenvolver soluções baseadas em LLMs, incluindo RAG (Retrieval-Augmented Generation).
Projetar e implementar pipelines de indexação, recuperação e ranking de informação.
Criar e otimizar prompts visando qualidade, consistência e segurança das respostas.
Construir APIs de IA utilizando FastAPI.
Integrar modelos de linguagem a sistemas existentes.
Desenvolver e manter pipelines de dados e inferência.
Avaliar e monitorar desempenho de sistemas de IA em produção.
Trabalhar em ambiente ágil seguindo práticas de SCRUM.
Responsabilidades
Desenvolver soluções baseadas em LLMs, incluindo RAG (Retrieval-Augmented Generation).
Projetar e implementar pipelines de indexação, recuperação e ranking de informação.
Criar e otimizar prompts visando qualidade, consistência e segurança das respostas.
Construir APIs de IA utilizando FastAPI.
Integrar modelos de linguagem a sistemas existentes.
Desenvolver e manter pipelines de dados e inferência.
Avaliar e monitorar desempenho de sistemas de IA em produção.
Trabalhar em ambiente ágil seguindo práticas de SCRUM.
Requisitos:
Forte base em Estatística e Álgebra Linear aplicadas a Machine Learning.
Proficiência em Python, com foco em engenharia de software.
Conhecimento sólido em Design Patterns em Python.
Experiência com SQL e Sistemas de Gerenciamento de Banco de Dados.
Capacidade de manipular dados estruturados e não estruturados.
Experiência com Docker.
Proficiência no uso do Git.
Experiência no desenvolvimento de APIs com FastAPI.
Conhecimento em NLP.
Experiência prática com LLMs.
Experiência com RAG (Retrieval-Augmented Generation).
Conhecimento em Prompt Engineering (design, avaliação e otimização de prompts).
Experiência com frameworks de orquestração de IA:
LangChain
LangGraph
CrewAI
Diferenciais:
Experiência com sistemas de busca e ranking:
TF-IDF
BM25
Conhecimento em Solr, Lucene e/ou Elasticsearch.
Experiência com MoreLikeThis (Lucene).
Conhecimento de métricas de avaliação de busca e recuperação:
MAP
NDCG
Precision@k
Recall@k
MRR
Experiência com sistemas de recomendação.
Experiência com redes neurais profundas.
Familiaridade com BERT e modelos similares.
Experiência com deploy, versionamento e monitoramento de modelos.