Qualificar TI

faLinkedin

faInstagram

<h2><strong>Descrição Geral dos Serviços</strong></h2>
<ul>
<li>Este serviço compreende a criação e manutenção assistida de Processos de Coleta e Armazenamento de Dados em um formato adequado para análise;</li>
<li>Apoio em atividades relacionadas a manutenção da infraestrutura necessária para o funcionamento contínuo dos pipelines de dados;</li>
<li>Coleta de dados com níveis de segurança exigidos pela empresa, seguindo a Metodologia de Consumo de dados;</li>
<li>Disponibilização de dados em camada utilizável por diversos consumidores de dados;</li>
</ul>
<h2><strong>Atividades Básicas</strong></h2>
<ul>
<li>Implementar Pipeline de Dados previamente projetados para coleta, armazenamento e organização dos dados brutos de várias fontes;</li>
<li>Manter os pipelines de dados para que executem seguindo programações, prazos e qualidade dos dados;</li>
<li>Garantir que os dados estejam disponíveis quando necessário, capturados de maneira eficiente e segura;</li>
<li>Integrar diversas fontes de dados em camada analítica disponível para consumo;</li>
<li>Transformar e limpar os dados antes de disponibilizá-los para uso;</li>
<li>Realizar levantamento e detalhamento dos dados nas bases fonte e alvo definidas para o pipeline de dados;</li>
<li>Elaborar e manter atualizado os artefatos definidos na Metodologia de Consumo de Dados;</li>
<li>Realizar outras tarefas, não especificadas acima, inerentes à função;</li>
</ul>
<h2><strong>Requisitos Básicos dos Perfis</strong></h2>
<ul>
<li>Curso superior completo, preferencialmente na área de informática ou em área afim (tecnologia da informação);</li>
</ul>
<p>Experiência em Projetos de Dados, na função de Engenheiro de Dados Júnior, que comprovem a experiência prática em:</p>
<ul>
<li>Tecnologias e ferramentas associadas a bancos de dados relacionais (Ex.: IBM DB2/SQL Server</li>
<li>Desenvolvimento de processos ETL, para ingestão, transformação e consumo de dados;</li>
<li>Ferramentas de Integração de Dados (ex.: IBM DataStage, Pentaho Data Integration, entre outras.);</li>
<li>Modelagem de dados Entidade e Relacionamento, Esquema Estrela ou Multidimensional;</li>
<li>Linguagem SQL;</li>
<li>Trabalho em times ágeis utilizando metodologia Scrum ou Kanban.</li>
</ul>
<p>Conhecimentos desejáveis em:</p>
<ul>
<li>Sistemas de processamento distribuído com paralelismo e tolerância a falhas (Ex.: Apache Spark) de alta performance, disponibilidade e escalabilidade;</li>
<li>Linguagens Python, Scala, Java ou Pyspark;</li>
<li>Framework de armazenamento e processamento distribuídos para grandes conjuntos de dados em cluster (Ex.: Apache Hadoop);&nbsp;</li>
</ul>

Oops!!

Parece que essa vaga não está mais disponível!