Olá! Boas-vindas ao curso de gestão de dados com dbt: transformações modernas de dados. Meu nome é Vitorino Vila e, durante este curso, eu acompanharei você na construção de um projeto completo utilizando dbt e PostgreSQL.
Sou profissional da área de dados e atuo em projetos que envolvem transformações, modelagem, integrações e qualidade de dados. Posso afirmar que o dbt nos ajuda muito ao longo de todo esse processo.
Neste curso, nós vamos compartilhar não apenas comandos e teorias, mas, principalmente, uma visão prática de como o dbt é utilizado em projetos reais.
Atualmente, o dbt se tornou uma das ferramentas mais importantes na engenharia de dados moderna, pois permite transformar dados diretamente no banco de dados usando SQL. Além disso, possibilita versionamento, testes, documentação e organização de todo o fluxo analítico.
Hoje, empresas de todos os portes utilizam o dbt para construir ambientes analíticos mais confiáveis, organizados e escaláveis.
O objetivo deste curso é demonstrar, na prática, como transformar dados brutos em modelos analíticos, trabalhando em um cenário realista de uma empresa de e-commerce (comércio eletrônico) e enfrentando problemas comuns do dia a dia em projetos de dados.
Ao longo do curso, criaremos um projeto completo com dbt, passando pelas etapas mais importantes: da criação da camada raw (bruta) até a construção dos modelos analíticos finais.
Começaremos preparando o ambiente: instalando PostgreSQL, dbt, VS Code e carregando os dados brutos. Em seguida, iniciaremos o projeto com dbt, compreenderemos sua estrutura e executaremos as primeiras transformações na camada de staging (preparação).
Resolveremos problemas reais de qualidade de dados, como dados inconsistentes, valores nulos, preços como texto e a padronização de informações.
Depois, construiremos modelos intermediários, nos quais aplicamos join (junção), criamos métricas e, por fim, estruturamos a camada analítica final.
Também veremos testes de qualidade, testes de integridade referencial e validações personalizadas e, ao final, geraremos toda a documentação do dbt, explorando as relações entre os modelos.
Se você deseja aprender dbt de forma prática, moderna e aplicada ao mercado, este curso foi feito para você.
Prepare seu ambiente, abra seu editor e vamos iniciar nosso projeto. Um abraço e até o próximo vídeo.
O que é o dbt e onde atua? Vamos começar.
Neste curso, nós vamos aprender a transformar dados de forma moderna, utilizando uma ferramenta amplamente utilizada no mercado: o dbt, sigla para Data Build Tool (Ferramenta de Construção de Dados).
Antes de iniciar a parte prática, é importante entendermos rapidamente o que é o dbt e, principalmente, onde ele se encaixa dentro de um fluxo de dados. Já adiantamos: o dbt não é uma ferramenta de ingestão de dados. Ele não extrai dados de APIs (Interfaces de Programação de Aplicações), não lê arquivos diretamente e não carrega dados no banco de dados.
O dbt atua em um momento específico do processo, quando os dados já estão dentro do banco de dados e precisam ser organizados, transformados e preparados para análise.
Vamos considerar uma situação comum. Uma empresa possui vários sistemas que geram muitos dados: sistemas de vendas, cadastro de clientes, produtos e pedidos. Esses dados são armazenados em um banco de dados, mas, normalmente, estão em formato bruto, com muitas inconsistências, duplicidade e pouca padronização.
Nesse momento, entra o dbt. O papel do dbt é receber esses dados brutos e transformá-los em dados confiáveis, organizados e prontos para análise. E, o mais importante, ele faz isso utilizando SQL. Ou seja, se já conhecemos SQL, já temos a principal habilidade necessária para trabalhar com o dbt.
Na prática, o dbt funciona de forma simples. Escrevemos uma consulta SQL que define como os dados devem ser transformados. Essas consultas são organizadas em modelos dentro de um projeto. Quando executamos o dbt, ele toma essas consultas e cria tabelas ou views (visualizações) dentro do banco de dados, com os dados já transformados. Ou seja, o dbt não processa os dados fora do banco de dados; utiliza o próprio banco de dados como mecanismo de execução. Isso traz uma grande vantagem: escalabilidade e desempenho, pois o processamento ocorre diretamente onde os dados estão.
Ao longo deste curso, nós vamos trabalhar com um cenário bastante realista de dados de um e-commerce (comércio eletrônico). Começaremos com dados brutos, cheios de problemas, e utilizaremos o dbt para transformar esses dados passo a passo. Nós vamos aprender a organizar os dados, corrigir inconsistências, criar modelos analíticos, garantir a qualidade com testes e documentar todo esse processo ao final. No fim, teremos construído um pipeline (esteira) completo de transformação de dados utilizando o dbt.
Agora que já entendemos o papel do dbt, no próximo vídeo conheceremos o cenário prático que vamos utilizar ao longo do curso. Nós vamos entender melhor os dados com os quais vamos trabalhar aqui e como eles se conectam com o que vimos até agora. De acordo. Um abraço e até o próximo vídeo.
Apresentando o estudo de caso.
Agora que já entendemos o papel do dbt, vamos entrar no cenário prático que utilizaremos ao longo do curso. Vamos atuar como se trabalhássemos em uma empresa de comércio eletrônico.
Essa empresa vende produtos on-line, tem clientes cadastrados, recebe pedidos e registra todos esses dados em um banco de dados. No entanto, como ocorre em muitas empresas, esses dados foram gerados por sistemas operacionais e não foram preparados para análise. Isso significa que os dados existem, mas ainda não estão prontos para responder às perguntas do negócio.
É nesse contexto que nosso papel neste curso será o de atuar como profissionais de dados responsáveis por organizar essas informações. Não vamos coletar dados nem construir sistemas de ingestão que capturem dados e os gravem no banco. Nosso foco será transformar os dados existentes em algo confiável e utilizável.
Ou seja, vamos pegar os dados brutos e transformá-los em modelos analíticos que possam ser usados para gerar relatórios, dashboards (painéis) e análises. E é exatamente aqui que entra o dbt como ferramenta principal.
Vamos conhecer, então, as principais tabelas com as quais vamos trabalhar. Inicialmente, temos uma tabela de clientes, que contém informações básicas, como nome e e-mail. Temos uma tabela de pedidos, que registra cada compra realizada por um cliente.
Nós também temos uma tabela de itens de pedidos, que detalha quais produtos foram comprados em cada pedido.
Por fim, há uma tabela de produtos, com informações sobre os itens vendidos pela empresa. Essas tabelas estão relacionadas entre si, mas não estão organizadas da melhor forma possível para a análise. Apesar de termos todas essas informações, os dados que vamos apresentar aqui contêm diversos problemas.
Encontraremos, por exemplo, endereços de e-mail vazios ou duplicados, datas com formatos inconsistentes, preços armazenados como texto, valores nulos ou inválidos, registros duplicados e até dados órfãos, como pedidos sem cliente ou produtos inexistentes. Todos esses problemas tornarão a análise muito mais difícil. Os dados não serão confiáveis se estiverem nesse tipo de formato, com esse tipo de erro.
Ao longo deste curso, nós vamos resolver todos esses problemas usando dbt. Construiremos uma estrutura de dados organizada, passando por diferentes camadas. Primeiro, vamos limpar e padronizar os dados. Em seguida, vamos integrar e enriquecer essas informações. Por fim, vamos criar tabelas analíticas prontas para uso.
Ao final do curso, teremos um conjunto de dados confiável, estruturado e pronto para a análise.
No próximo vídeo, nós vamos preparar nosso ambiente de desenvolvimento para começar a trabalhar com esses dados na prática. Nós vamos instalar as ferramentas necessárias e garantir que tudo esteja pronto para começar a usar dbt.
De acordo? Um abraço. Até o próximo vídeo.
O curso Engenharia de Dados: dbt - Transformações Modernas de Dados possui 308 minutos de vídeos, em um total de 75 atividades. Gostou? Conheça nossos outros cursos de Engenharia de Dados em Data Science, ou leia nossos artigos de Data Science.
Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:
O Plano Plus evoluiu: agora com Luri para impulsionar sua carreira com os melhores cursos e acesso à maior comunidade tech.
2 anos de Alura
Matricule-se no plano PLUS 24 e garanta:
Jornada de estudos progressiva que te guia desde os fundamentos até a atuação prática. Você acompanha sua evolução, entende os próximos passos e se aprofunda nos conteúdos com quem é referência no mercado.
Programação, Data Science, Front-end, DevOps, Mobile, Inovação & Gestão, UX & Design, Inteligência Artificial
Formações com mais de 1500 cursos atualizados e novos lançamentos semanais, em Programação, Inteligência Artificial, Front-end, UX & Design, Data Science, Mobile, DevOps e Inovação & Gestão.
A cada curso ou formação concluído, um novo certificado para turbinar seu currículo e LinkedIn.
Acesso à inteligência artificial da Alura.
No Discord, você participa de eventos exclusivos, pode tirar dúvidas em estudos colaborativos e ainda conta com mentorias em grupo com especialistas de diversas áreas.
Faça parte da maior comunidade Dev do país e crie conexões com mais de 120 mil pessoas no Discord.
Acesso ilimitado ao catálogo de Imersões da Alura para praticar conhecimentos em diferentes áreas.
Explore um universo de possibilidades na palma da sua mão. Baixe as aulas para assistir offline, onde e quando quiser.
Luri Vision chegou no Plano Pro: a IA da Alura que enxerga suas dúvidas, acelera seu aprendizado e conta também com o Alura Língua que prepara você para competir no mercado internacional.
2 anos de Alura
Todos os benefícios do PLUS 24 e mais vantagens exclusivas:
Chat, busca, exercícios abertos, revisão de aula, geração de legenda para certificado.
Envie imagens para a Luri e ela te ajuda a solucionar problemas, identificar erros, esclarecer gráficos, analisar design e muito mais.
Aprenda um novo idioma e expanda seus horizontes profissionais. Cursos de Inglês, Espanhol e Inglês para Devs, 100% focado em tecnologia.
Escolha os ebooks da Casa do Código, a editora da Alura, que apoiarão a sua jornada de aprendizado para sempre.
Para quem quer atingir seus objetivos mais rápido: Luri Vision ilimitado, vagas de emprego exclusivas e mentorias para acelerar cada etapa da jornada.
2 anos de Alura
Todos os benefícios do PRO 24 e mais vantagens exclusivas:
Catálogo de tecnologia para quem é da área de Marketing
Envie imagens para a Luri e ela te ajuda a solucionar problemas, identificar erros, esclarecer gráficos, analisar design e muito mais de forma ilimitada.
Escolha os ebooks da Casa do Código, a editora da Alura, que apoiarão a sua jornada de aprendizado para sempre.
Conecte-se ao mercado com mentoria individual personalizada, vagas exclusivas e networking estratégico que impulsionam sua carreira tech para o próximo nível.