Você é apaixonado por tecnologia, inovação e quer fazer parte de uma equipe que está transformando o futuro com IA e Machine Learning? Então, essa é a sua chance!
Estamos buscando um(a) Cientista de Dados Pleno, venha fazer parte do nosso time.
ATIVIDADES:
- Executar análises exploratórias de dados.;
- Auxiliar na criação de soluções para os projetos;
- Realizar a limpeza, tratamento de dados, Feature Engineering e outras técnicas necessárias para preparação dos dados;
- Desenvolver modelos de machine learning para classificação, regressão e clusterização, supervisionados e não supervisionados, incluindo redes neurais;
- Trabalhar com técnicas para linguagem, como NLP tradicional (tokenização, preprocessamentos, remoção de stopwords, stemming/lemmatizer), além de LLM's para criação de embeddings e fine-tuning para tarefas específicas;
- Utilizar ferramentas como AWS/Azure/GCP para desenvolver os projetos em ambientes de cloud (quando necessário);
- Utilização de PySpark (ou ferramenta semelhante) para trabalhar com grande volume de dados;
- Criar visualizações de dados com dashboards;
- Aplicar boas práticas para desenvolver código Python (modularização, descrição de funções e classes, tipagem, etc);
- Trabalhar com Git (com GitHub ou GitLab) para controle e versionamento de código.
REQUISITOS:
- Formação concluída ou em andamento em Ciência da Computação, Estatística, Matemática, Física, Economia, Engenharias, ou áreas correlata;
- Cursos de especialização em Ciência de Dados concluídos;
- Experiência de 4 a 8 anos em projetos de Ciência de Dados;
- Proficiência em Python;
- Conhecimento em SQL;
- Conhecimento em estatística;
- Experiência com bibliotecas para Machine Learning, como Scikit-learn, Scipy, Tensorflow e PyTorch;
- Experiência com NLP tradicional e LLM's;
- Conhecimento em Linux;
- Experiência com alguma ferramenta de Cloud (AWS/Azure/GCP);
- Conhecimento em alguma ferramenta de visualização (Streamlit, Power BI, Metabase, Tableau);
- Experiência com Git (GitHub/GitLab);
- Será um diferencial Mestrado ou pos-graduação na área (em andamento ou concluído);
- Será um difencial conhecimento em PySpark;
- Será um diferencial conhecimento em Docker e MLFlow.
BENEFÍCIOS:
- Vale Alimentação {Cartão Flexível - CAJU};
- Auxílio Home Office {Cartão Flexível - CAJU};
- Duas semanas de Férias Remuneradas, após um ano de Paipe;
- Acesso á plataforma Fluency {8 idiomas};