Compartilhe esta vaga

Cientista de Dados PL

Compartilhe esta vaga

Remoto

Compartilhe esta vaga

Descrição da vaga

Você é apaixonado por tecnologia, inovação e quer fazer parte de uma equipe que está transformando o futuro com IA e Machine Learning? Então, essa é a sua chance!

Estamos buscando um(a) Cientista de Dados Pleno, venha fazer parte do nosso time.

ATIVIDADES:

  • Executar análises exploratórias de dados.;
  • Auxiliar na criação de soluções para os projetos;
  • Realizar a limpeza, tratamento de dados, Feature Engineering e outras técnicas necessárias para preparação dos dados;
  • Desenvolver modelos de machine learning para classificação, regressão e clusterização, supervisionados e não supervisionados, incluindo redes neurais;
  • Trabalhar com técnicas para linguagem, como NLP tradicional (tokenização, preprocessamentos, remoção de stopwords, stemming/lemmatizer), além de LLM's para criação de embeddings e fine-tuning para tarefas específicas;
  • Utilizar ferramentas como AWS/Azure/GCP para desenvolver os projetos em ambientes de cloud (quando necessário);
  • Utilização de PySpark (ou ferramenta semelhante) para trabalhar com grande volume de dados;
  • Criar visualizações de dados com dashboards;
  • Aplicar boas práticas para desenvolver código Python (modularização, descrição de funções e classes, tipagem, etc);
  • Trabalhar com Git (com GitHub ou GitLab) para controle e versionamento de código.

REQUISITOS: 

  • Formação concluída ou em andamento em Ciência da Computação, Estatística, Matemática, Física, Economia, Engenharias, ou áreas correlata;
  • Cursos de especialização em Ciência de Dados concluídos;
  • Experiência de 4 a 8 anos em projetos de Ciência de Dados;
  • Proficiência em Python;
  • Conhecimento em SQL;
  • Conhecimento em estatística;
  • Experiência com bibliotecas para Machine Learning, como Scikit-learn, Scipy, Tensorflow e PyTorch;
  • Experiência com NLP tradicional e LLM's;
  • Conhecimento em Linux;
  • Experiência com alguma ferramenta de Cloud (AWS/Azure/GCP);
  • Conhecimento em alguma ferramenta de visualização (Streamlit, Power BI, Metabase, Tableau);
  • Experiência com Git (GitHub/GitLab);
  • Será um diferencial Mestrado ou pos-graduação na área (em andamento ou concluído);
  • Será um difencial conhecimento em PySpark;
  • Será um diferencial conhecimento em Docker e MLFlow.

BENEFÍCIOS:

  • Vale Alimentação {Cartão Flexível - CAJU};
  • Auxílio Home Office {Cartão Flexível - CAJU};
  • Duas semanas de Férias Remuneradas, após um ano de Paipe;
  • Acesso á plataforma Fluency {8 idiomas}; 

Regime de Contratação

Pessoa Jurídica

Conhecimentos e Habilidades necessárias

Python
SQL
NLP
LINUX
LLMS
AWS
MACHINE LEARNING
Não encontrou a vaga que queria?
Faça parte do nosso Banco de Talentos

Desenvolvido por

Todos os Direitos Reservados - Recrutei © 2024