Buscamos uma pessoa para atuar como Engenheiro(a) de Dados Júnior com conhecimento em ferramentas de Visualização de dados e domínio de SQL, além de domínio de pelo menos uma linguagem de programação com objetivo de auxiliar na criação de pipelines de transformação de dados.
Como será o seu dia a dia:
É esperado que Engenheiro(a) de Dados Júnior apresente habilidades diversificadas como a capacidade de desenvolver consultas complexas em SQL e criar fluxos de tratamento de dados em ferramentas de BI ou desenvolver scripts em Pyspark, criar e fazer deploy de pipelines no Airflow.
Além disso, para esse papel é importante que a pessoa tenha conhecimento intermediário em modelagem de dados e construção de dashboards.
Mas, o dia a dia do time se resume a:
-
Levantar requisitos com as áreas de negócio, traduzindo as necessidades apontadas em indicadores-chave de desempenho (KPIs) e métricas de sucesso.
-
Desenvolver e otimizar consultas complexas em SQL para extrair e manipular os dados necessários para as análises.
-
Criar e manter dashboards e relatórios interativos e de alto impacto visual em ferramentas como Power BI, Looker ou Superset, garantindo a acuracidade e a clareza das informações.
-
Desenvolver processos de ELT (Extração, Carga e Transformação), garantindo a integridade e a performance do nosso ecossistema de dados.
-
Criar scripts de transformação e modelagem de dados utilizando Python e PySpark em ambientes como Jupyter Notebooks.
-
Realizar o deploy de novas DAGs, monitorar as execuções, identificar e solucionar erros para garantir a confiabilidade dos fluxos de dados.
Para atuar nessa posição, é essencial que tenha conhecimento em:
-
Visualização de Dados: Familiaridade na construção de cubos de dados e dashboards, com experiência em ferramentas como Power BI ou Looker.
-
Banco de Dados: Conhecimento intermediário em SQL e em bancos de dados relacionais.
-
Linguagem de Programação: Domínio de pelo menos uma linguagem orientada a dados, com forte preferência por Python.
-
Ingestão de Dados: Conhecimento em técnicas para ingestão de dados de diferentes fontes.
-
Comunicação: Habilidade para traduzir métricas e análises técnicas em uma linguagem clara e objetiva para stakeholders de negócio, seja através de textos, apresentações ou dashboards.
Será um diferencial se você tiver:
-
Experiência com ambiente cloud, preferencial GCP;
-
Conhecimento em ferramentas de orquestração de pipelines (como Airflow).
-
Ter experiência em Spark.
-
Experiência com Git;