[Instituto Ousia] – Data Engineering

28 de março de 2024
Aplicar Agora

Descrição da oportunidade

#Por que ser um Data Engineering no Instituto Ousia:

  • Ousia significa essência e quando potencializada pode ser melhor sempre
  • Implementamos cultura data-driven dentro das empresas, entregando #Ousia, preparando as pessoas do negócio em verdadeiros citizen data-science, para que possam operar e produzir os dados produzidos pela companhia 
  • Otimizamos e automatizamos as rotinas operacionais das empresas, através de dados e consultoria, para aumentar a essência das empresas, o ROI (viabilidade econômica, produtividade, satisfação) para as pessoas e negócios 
  • O time de dados é protagonista desta mudança e participa ativamente na estratégia e direcionamento do negócio, colaborando para o crescimento do negócio, entregando ao usuário uma experiência ainda mais simples 🙂
  • Você atuará lado-a-lado com as áreas de negócio, em um dos grandes players de Telecom do Brasil, direcionando suas tomadas de decisões com dados para resultados mais assertivos.

#O seu principal desafio no Instituto Ousia será:

  • Você atuará como parceiro e especialista nos desafios de cada produto e área do negócio, facilitando dados nas tomadas de decisão para resultados mais assertivos.
  • Você será estimulado a pensar e jogar junto com as diferentes áreas de negócio, atuando como especialista em dados e parceiro do negócio/produto no desenvolvimento de soluções que destaquem o valor de tomadas de decisões orientadas por dados, pelo simples fato de conhecê-los, analisá-los e criticá-los.

#O que você vai fazer todos os dias:

  • Minerar e extrair dados em diferentes repositórios
  • Interagir com as diferentes áreas do negócio/produto para entender seus desafios e gerar insights na aplicação de dados para cada modelo de negócio/produto
  • Explorar e preparar dados, modelar e implementar soluções em Python
  • Verificar e propor as tecnologias que serão aplicadas na interpretação dos dados para cada modelo de negócio/produto
  • Definir arquitetura na estrutura da ETL para cada modelo de negócio/produto
  • Integrar os diferentes ETLs com os serviços de DataCenter na apresentação estruturada dos dados

#Estamos atraindo vivências e experiências em:

  • Mineração e extração de dados em diferentes repositórios
  • Modelagem e abstração de dados aplicadas a diferentes modelos de negócio
  • Contar histórias a diferentes audiências do negócio e/ou projeto, utilizando dados
  • Programação em Python, aplicados a grandes volumes de dados, dados em tempo real, dados não estruturados, modelos estatísticos como regressão, otimização, clustering, árvores de decisão
  • Modelagem e consultas de dados em SQL, assim como desenvolver otimizações de queries e performance de consultas
  • Processamento em batch e streaming utilizando ferramenta PySpark para facilitar mudanças no código
  • Armazenamento e medição na capacidade de dados em ambiente Oracle

#E se você souber também…sua curva de aprendizado será acelerada !

  • ⁠Aplicação de Presto – emulador de SQL para facilitar a consulta no DataLake (HUE)
  • ⁠Ambiente em arquitetura Oracle
  • ⁠Utilização de ferramentas de versionamento – Git
  • Ambiente de processamento de dados em Cloudera, utilizando scripts em Shell, JAVA ou Python
  • Manipulação de diferentes fluxos de dados, ETLs utilizando Pyspark como orquestrador