[Instituto Ousia] – Data Engineering

28 de março de 2024

Ousia significa essência e quando potencializada pode ser melhor sempre
Implementamos cultura data-driven dentro das empresas, entregando #Ousia, preparando as pessoas do negócio em verdadeiros citizen data-science, para que possam operar e produzir os dados produzidos pela companhia
Otimizamos e automatizamos as rotinas operacionais das empresas, através de dados e consultoria, para aumentar a essência das empresas, o ROI (viabilidade econômica, produtividade, satisfação) para as pessoas e negócios
O time de dados é protagonista desta mudança e participa ativamente na estratégia e direcionamento do negócio, colaborando para o crescimento do negócio, entregando ao usuário uma experiência ainda mais simples 🙂
Você atuará lado-a-lado com as áreas de negócio, em um dos grandes players de Telecom do Brasil, direcionando suas tomadas de decisões com dados para resultados mais assertivos.

Você atuará como parceiro e especialista nos desafios de cada produto e área do negócio, facilitando dados nas tomadas de decisão para resultados mais assertivos.
Você será estimulado a pensar e jogar junto com as diferentes áreas de negócio, atuando como especialista em dados e parceiro do negócio/produto no desenvolvimento de soluções que destaquem o valor de tomadas de decisões orientadas por dados, pelo simples fato de conhecê-los, analisá-los e criticá-los.

Minerar e extrair dados em diferentes repositórios
Interagir com as diferentes áreas do negócio/produto para entender seus desafios e gerar insights na aplicação de dados para cada modelo de negócio/produto
Explorar e preparar dados, modelar e implementar soluções em Python
Verificar e propor as tecnologias que serão aplicadas na interpretação dos dados para cada modelo de negócio/produto
Definir arquitetura na estrutura da ETL para cada modelo de negócio/produto
Integrar os diferentes ETLs com os serviços de DataCenter na apresentação estruturada dos dados

Mineração e extração de dados em diferentes repositórios
Modelagem e abstração de dados aplicadas a diferentes modelos de negócio
Contar histórias a diferentes audiências do negócio e/ou projeto, utilizando dados
Programação em Python, aplicados a grandes volumes de dados, dados em tempo real, dados não estruturados, modelos estatísticos como regressão, otimização, clustering, árvores de decisão
Modelagem e consultas de dados em SQL, assim como desenvolver otimizações de queries e performance de consultas
Processamento em batch e streaming utilizando ferramenta PySpark para facilitar mudanças no código
Armazenamento e medição na capacidade de dados em ambiente Oracle

⁠Aplicação de Presto – emulador de SQL para facilitar a consulta no DataLake (HUE)
⁠Ambiente em arquitetura Oracle
⁠Utilização de ferramentas de versionamento – Git
Ambiente de processamento de dados em Cloudera, utilizando scripts em Shell, JAVA ou Python
Manipulação de diferentes fluxos de dados, ETLs utilizando Pyspark como orquestrador

[Qbem] – Desenvolvedor Backend C#