Data Science

PySpark: processamento e modelagem em larga escala

Estudar na Alura

8hCarga horária

57Atividades

112Estudantes

0,0Avaliação média

01Certificado

8hCarga horária

57Atividades

O que você vai aprender

Leia diferentes formatos de dados (CSV, JSON, Parquet) e carregue-os em DataFrames do PySpark.
Modele e transforme grandes volumes de dados aplicando joins, agregações e funções de janela para análises avançadas.
Otimize consultas e pipelines aproveitando conceitos de Lazy Evaluation e o Catalyst Optimizer.
Construa pipelines de processamento e de modelagem com suporte de IA que integrem etapas de transformação e preparo de features.
Treine, valide e compare modelos de regressão e classificação usando validação cruzada e ajuste de hiperparâmetros.
Salve e reutilize pipelines e modelos para aplicar previsões em novos conjuntos de dados.

Público alvo

Profissionais e estudantes de dados, como analistas, cientistas de dados e desenvolvedores Python, que desejam aprender a processar grandes volumes com Spark e construir pipelines de modelagem. Recomenda-se conhecimento prévio de SQL e Python.

Iniciar curso

Ementa

Apresentação
Preparando o ambiente
Conhecendo Spark
Instalando o PySpark
Spark Session
Catalyst Optimizer na otimização de consultas de segurança
Para saber mais: catalyst optimizer do Apache Spark
O que aprendemos?

Descubra se esse curso é pra você!

Certificado reconhecido pelas maiores
empresas do Brasil e do mundo.

Aprenda com
quem está
construindo
o mercado

Vitor Mello

Sou Senior Staff Data Scientist na Neon , com passagens por empresas como Nubank e QuintoAndar. Espe...

Vitor Mello

Sou Senior Staff Data Scientist na Neon , com passagens por empresas como Nubank e QuintoAndar. Espe...

www.linkedin.com/in/vhomello/

Data Science

Trabalhe com dados. Aprofunde seu conhecimento nas principais ferramentas de uma pessoa data scientist. Descubra as diferentes possibilidades de análise de dados, do Excel ao Python, e mergulhe em frameworks e bibliotecas, como Pandas, Scikit-Learn e Seaborn.

Explore conteúdos

Inicie sua jornada agora.

Cursos relacionados em Engenharia de Dados

Azure Data Lake:

criando um pipeline de ingestão de dados

Ver mais em Data ScienceCertificado Alura

Engenharia de Dados:

Data Warehouses Modernos - Snowflake

Ver mais em Data ScienceCertificado Alura

Spark:

processamento de linguagem natural

Ver mais em Data ScienceCertificado Alura

Pipeline de dados:

integrando Python com MongoDB e MySQL

Ver mais em Data ScienceCertificado Alura

Quem aprende junto,
avança mais rápido.

Conheça as pessoas que estão aprendendo com esse curso agora:

Deivid de Jesus Martins

Rafael de Lima Peixoto

Gabriel Luna da Silva

Wesley Chedlovski

Michael Henrique de Oliveira

Deivid de Jesus Martins

Rafael de Lima Peixoto

Gabriel Luna da Silva

Wesley Chedlovski

Escolha o plano certo para seu
momento de carreira.

O maior desconto!

Plus 24

44% OFF

Preço original: ~~R$ 244,00~~

12x

R$136,64

2 anos de Alura

Valor à vista com desconto: R$ 1.639,68

Matricule-se

O Plano Plus evoluiu: agora com Luri para impulsionar sua carreira com os melhores cursos e acesso à maior comunidade tech.

26 Carreiras
2.224 Cursos
Acesso a TODOS os cursos por 2 anos
Certificado
Luri Chat, a inteligência artificial da Alura
Mentorias em grupo com especialistas
Comunidade exclusiva
Acesso ao conteúdo das Imersões
App Android e iOS para estudar onde quiser

26 Carreiras
2.224 Cursos
Acesso a TODOS os cursos por 2 anos

Matricule-se

Ver todos benefícios

Pro 24

44% OFF

Preço original: ~~R$ 322,00~~

12x

R$180,32

2 anos de Alura

Valor à vista com desconto: R$ 2.163,84

Matricule-se

Luri Vision chegou no Plano Pro: a IA da Alura que enxerga suas dúvidas, acelera seu aprendizado e conta também com o Alura Língua que prepara você para competir no mercado internacional.

26 Carreiras
2.224 Cursos
Acesso a TODOS os cursos por 2 anos
Certificado
Mentorias em grupo com especialistas
Comunidade exclusiva
Acesso ao conteúdo das Imersões
App Android e iOS para estudar onde quiser
Luri, acesso ilimitado a todas as funcionalidades da IA da Alura
Luri Vision, a IA que enxerga suas dúvidas
Alura Língua - Inglês e Espanhol
2 Ebooks da Casa do Código

26 Carreiras
2.224 Cursos
Acesso a TODOS os cursos por 2 anos

Matricule-se

Ver todos benefícios

Mais escolhido

Ultra Lab 24

44% OFF

Preço original: ~~R$ 640,00~~

12x

R$358,40

2 anos de Alura

Valor à vista com desconto: R$ 4.300,80

Matricule-se

Para quem quer atingir seus objetivos mais rápido: Luri Vision ilimitado, vagas de emprego exclusivas e mentorias para acelerar cada etapa da jornada.

26 Carreiras
2.224 Cursos
Acesso a TODOS os cursos por 2 anos
Certificado
Mentorias em grupo com especialistas
Martech Lab
Comunidade exclusiva
Acesso ao conteúdo das Imersões
App Android e iOS para estudar onde quiser
Luri, acesso ilimitado a todas as funcionalidades da IA da Alura
Luri Vision, a IA que enxerga suas dúvidas de forma ilimitada
Talent Lab, mentorias individuais e vagas exclusivas
Alura Língua - Inglês e Espanhol
6 Ebooks da Casa do Código

26 Carreiras
2.224 Cursos
Acesso a TODOS os cursos por 2 anos

Matricule-se

Ver todos benefícios

Pague com cartão de crédito ou PayPal em até 12x, NuPay em até 24x
ou à vista no Pix, com 5% de desconto extra.

Garantimos cancelamento gratuito em até 7 dias.

Conheça os Planos para Empresas

PySpark: processamento e modelagem em larga escala

O que você vai aprender

Público alvo

Ementa

Fundamentos do Spark e PySpark

Entrada e Saída de Dados

Seleções, Criação de Colunas e Transformações Essenciais

Agregações, GroupBy e Joins

Window Functions

Consultas, Ordenação e Spark SQL

Preparação de Dados para Machine Learning com PySpark MLlib

Modelagem Preditiva e Pipelines em MLlib

Avaliação, Otimização e Deploy Técnico de Modelos

Aprenda comquem estáconstruindoo mercado

Vitor Mello

Vitor Mello

Data Science

Cursos relacionados em Engenharia de Dados

Azure Data Lake:

Engenharia de Dados:

Spark:

Pipeline de dados:

Quem aprende junto,avança mais rápido.

Conheça as pessoas que estão aprendendo com esse curso agora:

Escolha o plano certo para seumomento de carreira.

Plus 24

Pro 24

Ultra Lab 24

Escolha o plano certo para seumomento de carreira.

Plus 24

Pro 24

Ultra Lab 24

Aprenda com
quem está
construindo
o mercado

Quem aprende junto,
avança mais rápido.

Escolha o plano certo para seu
momento de carreira.

Escolha o plano certo para seu
momento de carreira.