Aniversário
Alura 12 anos

20% OFF

Falta pouco!

00

DIAS

00

HORAS

00

MIN

00

SEG

Logo do curso
Curso

Databricks e Data Factory:

criando e orquestrando pipelines na nuvem

Quero estudar na alura

10h

Para conclusão

2694

Pessoas nesse curso

9.3

Avaliação média

Certificado

De participação

Introdução_

O que você aprenderá_

  • Entenda como construir um pipeline de Engenharia de Dados
  • Crie e estruture um Data Lake utilizando o Azure Data Lake Storage Gen 2
  • Configure o Databricks com o serviço de Cloud da Azure
  • Desenvolva notebooks no Databricks utilizando a linguagem Scala
  • Construa pipelines utilizando o Azure Data Factory
  • Integre todo seu projeto de Engenharia de Dados com o GitHub
  • Defina gatilhos de execução e coloque seu pipeline em produção

Público alvo_

Pessoas engenheiras de dados; profissionais que desejam integrar Databricks com a Azure; pessoas que desejam construir um pipeline completo de engenharia de dados para acrescentar ao portfólio.

Millena Gená Pereira

github

linkedin

Millena Gená é estudante de Ciência da Computação. Atualmente, é Instrutora de Dados aqui na Alura atuando principalmente na área de Engenharia de dados. Ela está sempre procurando aprender algo novo sobre tecnologia e é apaixonada por novas aventuras. Programar e ajudar as pessoas são seus hobbies favoritos! ^^

Curso atualizado em 03/07/2023

Ementa

  1. Configurando recursos da Azure

    • Entendendo o pipeline
    • Criando um grupo de recursos
  2. Estruturando o Data Lake

    • Criando a conta de armazenamento
    • Estruturando diretórios do Data Lake
    • Criando um registro de aplicativo
    • Atribuindo permissões
  3. Preparando o Databricks

    • Configurando o Databricks
    • Integrando Databricks com GitHub
    • Criando um cluster
  4. Trabalhando os dados no Databricks

    • Montando acesso aos dados
    • Executando o mount no Databricks
    • Transformando os dados para a camada bronze
    • Transformando os dados para a camada silver
    • Salvando os notebooks no GitHub
  5. Orquestrando com Data Factory

    • Criando o Data Factory
    • Integrando Data Factory com GitHub
    • Criando um pipeline
    • Configurando acesso ao Databricks
  6. Finalizando a orquestração

    • Testando o pipeline
    • Criando um gatilho
    • Deletando os recursos

Descubra se esse curso é pra você! Leia as primeiras aulas

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos

Este e mais 5 cursos fazem parte das seguintes formações

Nossas formações são uma sequência de cursos e conteúdo para você se profissionalizar e se tornar quem o mercado procura!
Escola

Data Science

Trabalhe com dados. Aprofunde seu conhecimento nas principais ferramentas de uma pessoa data scientist. Descubra as diferentes possibilidades de análise de dados, do Excel ao Python, e mergulhe em frameworks e bibliotecas, como Pandas, Scikit-Learn e Seaborn.

Conheça a escola

Pessoas estudando esse curso nesse mês:

Estude com elas

e mais 91 pessoas

Faça parte da nossa comunidade no discord!

Troque conhecimentos com a comunidade da Alura

Escolha a duração
do seu plano

Conheça os Planos para Empresas