Aniversário
Alura 12 anos

20% OFF

Falta pouco!

00

DIAS

00

HORAS

00

MIN

00

SEG

Logo do curso
Curso

Databricks:

trabalhando com diversos formatos e tipos de arquivos

Quero estudar na alura

8h

Para conclusão

2065

Pessoas nesse curso

9

Avaliação média

Certificado

De participação

Introdução_

O que você aprenderá_

  • Compreenda os conceitos dos formatos de arquivo JSON, CSV, TXT, AVRO, Parquet e ORC
  • Entenda as vantagens e desvantagens de utilizar os diferentes tipos de arquivos
  • Aprenda a ler e salvar arquivos em diferentes formatos
  • Realize a compressão dos arquivos
  • Aprenda sobre as diferentes opções que há no PySpark no momento da leitura e escrita de arquivos
  • Faça uma análise comparativa entre os arquivos estudados

Público alvo_

Pessoas que trabalham com Big Data e precisam conhecer os formatos e tipos de arquivos utilizados no Databricks.

Bruno Raphaell

github

linkedin

Bruno é um instrutor de Data Science e Engenheiro Eletricista pela Universidade Federal do Piauí. Se dedica em áreas como Data Science, Machine Learning e Deep Learning, e possui grande interesse em engenharia de dados e engenharia de machine learning. Além disso, em seu tempo livre, ele gosta de jogar xadrez, tocar instrumentos musicais e jogar League of Legends.

Nara Miranda Guimarães

github

linkedin

Sarah David Müzel

Curso atualizado em 13/02/2025

Ementa

  1. Conhecendo o DBFS e dbutils

    • Entendendo o problema
    • Apresentando o DBFS e dbutils
  2. Conhecendo o JSON e CSV

    • O que é um arquivo JSON?
    • Salvando o JSON comprimido
    • O que é um arquivo CSV?
    • Salvando o CSV com compressão
  3. Conhecendo o TXT e AVRO

    • O que é um arquivo TXT?
    • Salvando o TXT comprimido
    • O que é um arquivo AVRO?
    • Salvando AVRO com compressão
  4. Conhecendo o PARQUET e ORC

    • O que é um arquivo Parquet?
    • Trabalhando com particionamento
    • O que é um arquivo ORC?
    • Agrupando as partições

Descubra se esse curso é pra você! Leia as primeiras aulas

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos

Este e mais 5 cursos fazem parte das seguintes formações

Nossas formações são uma sequência de cursos e conteúdo para você se profissionalizar e se tornar quem o mercado procura!
Escola

Data Science

Trabalhe com dados. Aprofunde seu conhecimento nas principais ferramentas de uma pessoa data scientist. Descubra as diferentes possibilidades de análise de dados, do Excel ao Python, e mergulhe em frameworks e bibliotecas, como Pandas, Scikit-Learn e Seaborn.

Conheça a escola

Pessoas estudando esse curso nesse mês:

Estude com elas

e mais 104 pessoas

Faça parte da nossa comunidade no discord!

Troque conhecimentos com a comunidade da Alura

Escolha a duração
do seu plano

Conheça os Planos para Empresas