Original listing text, shown exactly as published by the company.
Na CI&T , ajudamos grandes empresas a transformar o potencial da AI em impacto real nos negócios com AI Deployment, execução AI-native e tech-integrated business solutions.
Com 30 anos de experiência em transformação tecnológica, aceleramos inovação com expertise em agentic SDLC, application modernization, Data & AI, martech e business strategy.
Somos 8.000 CI&Ters em mais de 25 países, colaborando para construir soluções com impacto real. AI já faz parte da forma como trabalhamos, evoluímos e inovamos todos os dias.
Importante: se você reside na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequencia vigente.
Estamos em busca de uma pessoa para atuar como Engenheiro(a) de Dados Sênior em um projeto estratégico voltado à concepção, construção e evolução de soluções inteligentes baseadas em IA Generativa, agentes e multiagentes, aplicadas ao domínio de Cadastro de Clientes, com foco em integração, processamento, análise autônoma de dados, identificação de padrões, geração de recomendações e suporte à tomada de decisão.
O profissional será responsável por transformar dados cadastrais em inteligência acionável, utilizando engenharia de dados, Analytics avançado, Machine Learning, LLMs, Databricks, PySpark e soluções em ambientes cloud, apoiando a evolução do Golden Record, da qualidade de dados e da governança de MDM.
Além disso, atuará na construção e sustentação de pipelines escaláveis, processamento de dados em ambiente Big Data, produtização de modelos de Machine Learning e aplicação de boas práticas de desenvolvimento, versionamento e qualidade.
Essência do papel
Não buscamos apenas um profissional para construir pipelines isolados.
Buscamos um Engenheiro de Dados Sênior capaz de estruturar, integrar, transformar e disponibilizar dados com inteligência, utilizando dados, IA e engenharia para apoiar recomendações, automações e ações sobre o Cadastro de Clientes, gerando valor mensurável para o negócio.
Principais tecnologias e competências envolvidas
- IA Generativa e LLMs
- Arquiteturas de agentes e multiagentes
- RAG, agentes autônomos e workflows inteligentes
- Machine Learning aplicado
- Analytics avançado
- Python
- SQL
- Databricks com PySpark
- Spark
- Azure Databricks
- GCP e Gemini
- Processamento de dados em tempo quase real com Kafka
- MLOps e produtização de modelos no Databricks
- Esteiras de CI/CD com GitHub e GitHub Actions
- Qualidade de dados, governança e MDM
- Golden Record e dados cadastrais
- Experiência com metodologias ágeis
Principais responsabilidades
- Desenvolver, otimizar e manter pipelines de dados escaláveis utilizando Databricks, Spark e PySpark.
- Atuar na integração, transformação, tratamento e disponibilização de dados cadastrais em larga escala.
- Construir e manter produtos de dados em ambiente Big Data na nuvem, assegurando escalabilidade, performance, confiabilidade e qualidade.
- Trabalhar com dados do domínio de Cadastro de Clientes, apoiando iniciativas relacionadas a Golden Record, qualidade de dados, governança e MDM.
- Projetar e implementar soluções de dados que apoiem sistemas inteligentes baseados em IA Generativa, agentes e multiagentes.
- Preparar, estruturar e disponibilizar dados para consumo por modelos de Machine Learning, LLMs, agentes autônomos e workflows inteligentes.
- Apoiar a construção de agentes e multiagentes capazes de analisar dados cadastrais em larga escala.
- Apoiar a identificação de padrões, inconsistências, gaps, duplicidades, anomalias e oportunidades de melhoria em dados cadastrais.
- Desenvolver mecanismos de dados para geração de alertas, recomendações explicáveis e suporte à tomada de decisão.
- Aplicar técnicas de Analytics e Machine Learning para detecção de anomalias, classificação, clusterização e scoring de dados cadastrais.
- Apoiar estratégias de qualificação, enriquecimento, priorização e governança de dados.
- Utilizar IA Generativa para apoiar a geração, evolução, validação e explicação de regras de negócio.
- Explorar e apoiar a implementação de arquiteturas como RAG, agentes autônomos, multiagentes e workflows inteligentes.
- Atuar com processamento de dados em tempo quase real utilizando Kafka.
- Apoiar a produtização de modelos de Machine Learning no Databricks, aplicando conceitos de MLOps.
- Criar, manter e evoluir esteiras de CI/CD utilizando GitHub e GitHub Actions.
- Garantir boas práticas de desenvolvimento, assegurando que as soluções sigam padrões de qualidade, eficiência, manutenibilidade e governança.
- Otimizar o uso dos dados disponíveis para maximizar seu valor para as áreas de negócio e tecnologia.
- Colaborar com equipes de MDM, Dados, Tecnologia e Negócio, garantindo que as soluções desenvolvidas sejam mensuráveis, governáveis e aplicáveis.
- Apoiar refinamentos técnicos e funcionais, garantindo clareza, viabilidade e aderência das histórias às necessidades do projeto.
- Apoiar a construção de histórias de usuário claras, bem definidas e tecnicamente viáveis.
- Participar do desenho AS-IS e TO-BE, documentando processos atuais e futuros, identificando débitos técnicos, riscos e oportunidades de melhoria.
- Desenvolver histórias refinadas e aprovadas, garantindo qualidade, eficiência e aderência aos padrões técnicos.
- Atuar na identificação de débitos técnicos e propor melhorias contínuas em arquitetura, processos, dados e soluções.
- Trabalhar em parceria com focais de dados e de negócio para garantir alinhamento entre soluções técnicas, melhores práticas e necessidades estratégicas.
Qualificações necessárias
Conhecimentos técnicos
- Experiência sólida como Engenheiro(a) de Dados, Engenheiro(a) de Dados Sênior ou papel equivalente.
- Forte conhecimento em Python para engenharia de dados, automação, análise de dados e apoio a soluções de IA.
- Sólido conhecimento em SQL e exploração de dados estruturados.
- Experiência com Databricks, PySpark e Spark.
- Experiência na construção, otimização e sustentação de pipelines de dados escaláveis.
- Experiência em ambientes cloud, preferencialmente Azure Databricks e GCP.
- Conhecimento ou experiência com Gemini para apoio a soluções GenAI.
- Conhecimento em IA Generativa, LLMs e aplicações inteligentes baseadas em dados.
- Conhecimento em arquiteturas de agentes, multiagentes e sistemas autônomos.
- Vivência com RAG, workflows inteligentes, recomendação baseada em dados e automação cognitiva.
- Experiência com técnicas de Machine Learning aplicado, incluindo anomalias, classificação, clustering e scoring.
- Experiência com processamento de dados em tempo quase real, preferencialmente com Kafka.
- Experiência com produtização de modelos de Machine Learning no Databricks e práticas de MLOps.
- Experiência com esteiras de CI/CD, especialmente GitHub e GitHub Actions.
- Domínio de boas práticas de engenharia de dados, versionamento, testes, revisão de código e qualidade de dados.
- Conhecimento em lógica de programação, desenvolvimento de aplicações e otimização de performance.
- Capacidade de transformar problemas de negócio em soluções de dados, analíticas e inteligentes.
- Experiência em squads ágeis e metodologias ágeis.
Diferenciais
- Experiência com dados críticos, como clientes, identidade, cadastro ou KYC.
- Conhecimento em qualidade de dados, governança, MDM e Golden Record.
- Experiência prática com multiagentes, automação cognitiva ou sistemas baseados em decisões autônomas.
- Vivência em ambientes regulados.
- Conhecimento em estratégias de enriquecimento, deduplicação, matching e consolidação de dados cadastrais.
- Experiência com uso de IA no desenvolvimento, como GitHub Copilot, prompt engineering e code review automatizado.
Qualidades comportamentais
- Proatividade e curiosidade analítica.
- Interesse por inovação, IA e novas tecnologias.
- Perfil hands-on, com autonomia para conduzir atividades técnicas complexas.
- Capacidade analítica para interpretar bases de dados, regras de negócio, padrões e anomalias.
- Habilidade de resolução de problemas, identificando causas, riscos, impactos e alternativas.
- Perfil consultivo, trazendo ideias, soluções e melhorias para o projeto sem aguardar apenas direcionamentos.
- Visão 360º, entendendo o projeto como um todo e avaliando impactos técnicos, operacionais e de negócio.
- Comunicação assertiva, com clareza, confiança e respeito.
- Boa capacidade de interação com áreas técnicas, de negócio, dados, MDM e governança.
- Foco em resultados, produtividade e melhoria contínua.
- Capacidade de colaboração com times técnicos e de negócio.