71h

Para conclusão

8
Cursos
1
Vídeo extra
4
Artigos

O que você vai aprender?

Neste segundo treinamento você aprenderá o método ETL (Extração, Transformação e Carregamento), essencial para trabalhar com dados de forma eficiente. Exploraremos como extrair dados de diversas fontes, executar o processamento necessário para limpar e formatar as informações e, finalmente, carregar esses dados em um formato estruturado para análise. Esse processo é essencial para garantir que os dados estejam prontos para gerar insights e dar suporte à tomada de decisões.

Este treinamento faz parte do Programa ONE, uma aliança entre a Alura Latam e a Oracle.

Por favor, insira uma descrição desta imagem aqui para ajudar com a acessibilidade

Empresa Parceira
Oracle Next Education

Por que estudar esta formação?

  • Guia de aprendizado

    Conteúdos pensados para facilitar seu estudo

  • Do básico ao avançado

    Formação completa para o mercado

  • Você dentro do mercado

    Do zero ao sonhado emprego em sua área de interesse

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos

Com quem você vai aprender?

  • Mirla Costa

    Instrutora em Data Science, graduada em Engenharia Elétrica pela UFPI com pesquisa focada em Aprendizado de Máquina e Inteligência Computacional. Amante de programação, tecnologia, cachorros, animações e jogar RPG de mesa.

  • Mirla Costa

    Instrutora em Data Science, graduada em Engenharia Elétrica pela UFPI com pesquisa focada em Aprendizado de Máquina e Inteligência Computacional. Amante de programação, tecnologia, cachorros, animações e jogar RPG de mesa.

  • Valquíria Alencar

    Val é doutora em biotecnologia com pós-doutorado pela UFABC. Atualmente, é instrutora na escola de Data Science, onde desenvolve cursos voltados para análise de dados, modelos preditivos, IAs generativas e soluções inovadoras com LLMs. Também gosta de escrever e é coautora do livro Séries Temporais com Prophet pela Casa do Código. É apaixonada por tecnologia, One Piece, RPGs como Tibia e Stardew Valley, além de ser entusiasta de cafés especiais.

  • Valquíria Alencar

    Val é doutora em biotecnologia com pós-doutorado pela UFABC. Atualmente, é instrutora na escola de Data Science, onde desenvolve cursos voltados para análise de dados, modelos preditivos, IAs generativas e soluções inovadoras com LLMs. Também gosta de escrever e é coautora do livro Séries Temporais com Prophet pela Casa do Código. É apaixonada por tecnologia, One Piece, RPGs como Tibia e Stardew Valley, além de ser entusiasta de cafés especiais.

  • Allan Segovia Spadini

    Allan trabalha como instrutor de Ciência de dados na Alura desde 2019. Também é um dos autores do livro Séries temporais com Prophet pela Casa do Código.

  • Allan Segovia Spadini

    Allan trabalha como instrutor de Ciência de dados na Alura desde 2019. Também é um dos autores do livro Séries temporais com Prophet pela Casa do Código.

  • João Vitor de Miranda

    Bacharel em Matemática e pós graduado em Data Science e Analytics. Com conhecimento em Matemática, Estatística, Excel, Python, R e SQL/NoSQL.

  • João Vitor de Miranda

    Bacharel em Matemática e pós graduado em Data Science e Analytics. Com conhecimento em Matemática, Estatística, Excel, Python, R e SQL/NoSQL.

  • Afonso Augusto Rios

    Formado em Engenharia Elétrica e com projetos na área da educação básica e tecnológica. Apaixonado por tecnologia, futebol e estudo de línguas, tenta trazer um pouco de ambos os mundos para seus estudos. Atuou como professor de Matemática em escolas públicas de Petrolina, através de um ONG na área de educação, e em projetos educacionais em diversos estados. Com conhecimento em Python e Data Visualization, vem se desenvolvendo na linguagem R, SQL e Power BI.

  • Afonso Augusto Rios

    Formado em Engenharia Elétrica e com projetos na área da educação básica e tecnológica. Apaixonado por tecnologia, futebol e estudo de línguas, tenta trazer um pouco de ambos os mundos para seus estudos. Atuou como professor de Matemática em escolas públicas de Petrolina, através de um ONG na área de educação, e em projetos educacionais em diversos estados. Com conhecimento em Python e Data Visualization, vem se desenvolvendo na linguagem R, SQL e Power BI.

  • Alura

    Mergulhe em conteúdo com a maior comunidade de tecnologia do país.

  • Alura

    Mergulhe em conteúdo com a maior comunidade de tecnologia do país.

Passo a passo
  1. 1 Diagnóstico do que foi aprendido

    Esta etapa é obrigatória
    Conte-nos sobre o seu conhecimento adquirido até agora. É um diagnóstico pessoal e, portanto, é muito importante que você seja honesto em suas respostas.

  2. 2 Plano de estudos

    O plano de estudos é o primeiro passo para te auxiliar na organização da sua rotina de estudos.

    Este plano foi estrategicamente criado para te guiar neste novo caminho de aprendizagem, para ajudar você a estudar em menos tempo e aumentar o seu rendimento, além de auxiliar no foco e disciplina.

    Nele você encontrará a ordem sugerida em que deve fazer os cursos, e o tempo proposto em que deve concluir cada módulo. Com ele, você conseguirá acompanhar o ritmo do programa ONE e aproveitar ao máximo os seus tempos de estudo e cada trilha de aprendizagem.

    Foi feito utilizando a ferramenta Trello, que permite gerenciar qualquer tipo de projeto e tarefas, para utilizá-lo você deve acessar o link e se cadastrar gratuitamente, e seguir as recomendações que deixamos no quadro para usar este plano de estudos.

  3. 3 Pacote de dados

    Aprenda sobre a biblioteca NumPy para trabalhar com a manipulação de arrays, que permitem armazenar e fazer operações com dados. A biblioteca NumPy possui uma ampla variedade de operações em arrays, incluindo cálculos matemáticos, operações estatísticas básicas, classificação, seleção e muito mais.

    • Curso NumPy: análise numérica eficiente com Python

      08h
      • Aprenda a ler e escrever dados usando Numpy
      • Crie e manipule arrays multidimensionais
      • Saiba como gerar números aleatórios com a biblioteca Numpy
      • Descubra como utilizar seeds para trabalhar com aleatoriedade
      • Faça o cálculo de regressão linear com Numpy
      • Explore funções de agregação na Numpy
    • Artigo Numpy: trabalhando computação científica com Python | Alura

  4. 4 Pandas

    O Pandas é uma das bibliotecas mais importantes do Python para manipulação e análise de dados em projetos de Data Science. Nesta etapa da formação, você aprofundará seu contato com a ferramenta, aprendendo a aplicar seus principais recursos para organizar, transformar e extrair informações relevantes dos dados, aproximando ainda mais a teoria da prática.

    • Curso Pandas I/O: trabalhando com diferentes formatos de arquivos

      08h
      • Entenda o que são arquivos do tipo CSV, XLSX, JSON, HTML e XML
      • Compreenda como trabalhar com diferentes tipos de dados, tanto na entrada como na saída (input/output)
      • Leia dados provenientes do Google Planilhas
      • Obtenha tabelas a partir de páginas web
      • Crie um banco de dados local
      • Escreva em um banco de dados local
      • Realize consultas SQL
    • Curso Pandas: transformação e manipulação de dados

      06h
      • Entenda e aplique comandos de transformação de dados
      • Diferencie os tipos de informação que estão presentes nos dados
      • Manipule valores numéricos dentro do dataframe Pandas
      • Distingua métodos de manipulação de dados textuais
      • Realize transformações com tipo datetime de dados
      • Relacione conversões de dados à construção de projetos
    • Curso Pandas: selecionando e agrupando dados

      08h
      • Selecione e extraia informações a partir dos dados
      • Agrupe dados para criação de tabelas
      • Elabore gráficos para ajudar na análise dos dados
      • Aplique filtragem e seleção de dados usando a biblioteca pandas
    • Artigo Ampliando a análise com o Describe

    • Artigo Pandas Python: o que é, para que serve e como instalar

    • Vídeo - YouTube

  5. 5 Data Visualization

    Na etapa de Data Visualization, você aprenderá a criar gráficos e visualizações de dados utilizando várias bibliotecas populares em Python. Primeiramente, com Matplotlib, você entenderá como construir gráficos básicos, como linhas, barras e dispersão, explorando personalizações para deixar as visualizações claras e informativas. Em seguida, aprofundaremos o uso da Seaborn, que oferece uma interface de alto nível para criar gráficos estatísticos mais elegantes e complexos com menos código. Por fim, você explora a Plotly, uma biblioteca poderosa para criar gráficos interativos, permitindo que seus dados sejam visualizados de forma dinâmica e envolvente, com recursos como zoom, hover e filtros interativos.E, por fim, aprenderá como utilizar uma inteligência artificial generativa para te auxiliar no complemento das tarefas de ETL e análises de dados, automatizando processos e aumentando a eficiência de suas operações.

    • Curso Data Visualization: criando gráficos com bibliotecas Python

      10h
      • Aprenda a criar gráficos com a biblioteca Matplotlib
      • Entenda o funcionamento de figuras e eixos da biblioteca Matplotlib
      • Saiba como utilizar a biblioteca Seaborn para criação de gráficos
      • Crie gráficos interativos com a biblioteca Plotly
      • Customize suas visualizações com diferentes cores, estilos, anotações, etc.
      • Aprenda boas práticas para elaborar gráficos
    • Curso Data Visualization: estilização de tabelas com Python

      08h
      • Entenda as classes da biblioteca Pandas para estilizar tabelas
      • Conheça os built-in styles do Pandas que facilitam a estilização e suas utilidades
      • Crie próprias estilizações para tabelas com propriedades CSS
      • Trabalhe com DataFrames para apresentar as informações
      • Utilize de propriedades CSS para aplicar estilizações às tabelas
      • Construa tabelas para várias situações
    • Artigo Data Visualization: conhecendo as bibliotecas do Python | Alura

  6. 6 Challenge Telecom X

    Challenge

    • Curso Challenge Telecom X: análise de evasão de clientes

      10h
  7. 7 Inteligencia artificial aplicada a ciência de dados

    Neste módulo, você aprenderá a utilizar o ChatGPT como um assistente pessoal para a análise e visualização de dados, otimizando seu tempo na criação de gráficos e relatórios. Você descobrirá como elaborar visualizações personalizadas para apresentar informações de forma clara e eficaz ao seu público. Além disso, exploraremos as possibilidades e limitações do uso de IA na geração de diferentes tipos de gráficos. Por fim, você aplicará esses conhecimentos na construção de um relatório interativo utilizando ferramentas como o Gamma e o ChatGPT.

    • Curso IA aplicada a Data Science: utilizando IA na construção de visualização de dados

      10h
      • Saiba como utilizar o ChatGPT como assistente pessoal na análise e visualização de dados
      • Otimize o tempo na construção de visualizações de dados com o ChatGPT
      • Aprenda como construir uma visualização de dados customizada para a apresentação ao seu público
      • Conheça as limitações e possibilidade do uso de IAs na criação de visuais dos mais diversos tipos
      • Construa um relatório com os dados por meio dos recursos disponíveis de IAs como Gamma e ChatGPT

Escola

Data Science

Além dessa, a categoria Data Science conta com cursos de Ciência de dados, BI, SQL e Banco de Dados, Excel, Machine Learning, NoSQL, Estatística,e mais...

Conheça a Escola

Comece a estudar agora na maior escola de tecnologia do país

Conheça os Planos para Empresas