Institucional

Sobre nós
Trabalhe Conosco
Para Empresas
Para Escolas
Política de Privacidade
Compromisso de Integridade
Termos de Uso
Canal de Ética
Código de Ética
Fale Conosco
Documentos Institucionais
Status

Institucional

Sobre nós
Trabalhe Conosco
Para Empresas
Para Escolas
Política de Privacidade
Compromisso de Integridade
Termos de Uso
Canal de Ética
Código de Ética
Fale Conosco
Documentos Institucionais
Status

A Alura

Como Funciona
Inteligência Artificial
Plataforma
Depoimentos
Instrutores(as)
Dev em <T>
Luri, a Inteligência Artificial da Alura
IA Conference
Cursos Imersivos
Perguntas Frequentes

A Alura

Como Funciona
Inteligência Artificial
Plataforma
Depoimentos
Instrutores(as)
Dev em <T>
Luri, a Inteligência Artificial da Alura
IA Conference
Cursos Imersivos
Perguntas Frequentes

Conteúdos

Alura Cases
Imersões
Artigos
Podcasts
Artigos de educação corporativa

Conteúdos

Alura Cases
Imersões
Artigos
Podcasts
Artigos de educação corporativa

Uma Empresa do Grupo

Outras empresas do Grupo Alun

FIAP
STARTSE
PM3
LUMINA

Novidades e lançamentos

Ao submeter seu e-mail, você concorda com a política de privacidade da Alura.

Redes Sociais & Apps

Uma Empresa do Grupo

Outras empresas do Grupo Alun

FIAP
STARTSE
PM3
LUMINA

Novidades e lançamentos

Ao submeter seu e-mail, você concorda com a política de privacidade da Alura.

Redes Sociais & Apps

Novidades e lançamentos

Novidades e lançamentos

VAI ACABAR! até dia 29/07:

38% OFF + par de ingressos Cinemark

00HORAS

:

00MIN

:

00SEG

Comece sua evolução

Comece sua evolução

Home
Escolha seu Plano
Plus 2438% OFF
Pro 2438% OFF
Ultra Lab 2438% OFF
Carreiras Alura
Evolua com profundidade técnica, direção clara e aplicação prática.
Jornadas guiadas do básico ao avançado com checkpoints práticos, desenhadas para quem busca profundidade e protagonismo técnico.
CURSOS
Ver mais cursos de programação
Pensamento computacional: fundamentos da computação e lógica de programação
Lógica de programação: mergulhe em programação com JavaScript
Começando em Programação: carreira e primeiros passos
Git e GitHub: compartilhando e colaborando em projetos
Java: criando a sua primeira aplicação
CURSOS
Ver mais cursos de Data Science
Python para Dados: primeiros passos
Excel: domine o editor de planilhas
Python para Dados: trabalhando com funções, estruturas de dados e exceções
Power BI Desktop: construindo meu primeiro dashboard
SQLite online: conhecendo instruções SQL
CURSOS
Ver mais cursos de Inteligência Artificial
IA: Explorando o Potencial da Inteligência Artificial Generativa
Engenharia de Prompt: Criando Prompts Eficazes para IA Generativa
Aprendizagem: Personalizando Sua Rotina de Estudos com ChatGPT
Microsoft 365 Copilot: Dominando a Comunicação Produtiva
Negociação: Treinando Habilidades com IA
CURSOS
Ver mais cursos de Front-End
HTML e CSS: ambientes de desenvolvimento, estrutura de arquivos e tags
HTML e CSS: Classes, posicionamento e Flexbox
HTML e CSS: cabeçalho, footer e variáveis CSS
JavaScript: aprendendo a programar
HTML e CSS: praticando HTML/CSS
CURSOS
Ver mais cursos de DevOps
Segurança da Informação para todos: Proteja você e sua empresa
DevOps: explorando conceitos, comandos e scripts no Linux CLI
Redes: dos conceitos iniciais à criação de uma intranet
Linux: gerenciando diretórios, arquivos, permissões e processos
Cibersegurança: Fundamentos e práticas integradas
CURSOS
Ver mais cursos de UX & Design
UX Research: mapeando a experiência da pessoa usuária
UX Strategy: alinhando visão, metas e experiência do usuário
UX Design: Conheça o universo da experiência em produtos digitais
Figma: Conhecendo o programa
Product Design: métricas e ciclo de vida do produto
CURSOS
Ver mais cursos de Inovação e Gestão
Comunicação inclusiva e vieses inconscientes
Agilidade: como ela pode ajudar a criar um time de alta performance
Gestão ágil: explorando conceitos da agilidade
Management 3.0: gerencie o ambiente, não as pessoas
Aprendizado contínuo: desenvolvendo o perfil de lifelong learner
CURSOS
Ver mais cursos de Mobile
Dart: trabalhando com a sintaxe e configuração de projeto
React Native: desenvolvendo com Expo
Android parte 1: crie um app mobile
Dart: trabalhando com orientação a objetos
Dart: dominando assincronismo e criando comunicação com APIs
CARREIRAS
Ver mais carreiras
Especialista em IA
Engenharia de IA
Ai native software engineering
Arquitetura de Soluções com IA
AI Product Design
Engenharia de Machine Learning
Desenvolvimento Front-End React
Engenharia de Dados
Cloud Security
Social Media Marketing
Engenharia de Agentes de IA
CURSOS
Engenharia de Prompt: Prompts Eficazes para IA Generativa
Claude Code: Criando sua Primeira Aplicação
Python: Crie sua Primeira Aplicação
Git e GitHub: Compartilhando e Colaborando
N8N: Fluxos de Trabalho Avançados
CURSOS
Copilot Studio: Solução Multiagentes
Padrões de API HTTP e Modelagem de APIs
Python para Análise de Dados com SQL
Docker: Criando e Gerenciando Containers
Design com IA: Otimizando o Processo Criativo
CURSOS
Model Context Protocol (MCP)
Spec-Driven Development: Dev Assistido por Agentes
Arquitetura de Sistemas Distribuídos com Java
Governança de Modelos e Reprodutibilidade
Pentest: Vulnerabilidades em Aplicações Web
Escolha seu Plano
Plus 2438% OFF
Pro 2438% OFF
Ultra Lab 2438% OFF
Skills & Go
O Skills & Go é para Tech Leads, Product Managers, estrategistas e early adopters que transformam ideias em soluções de alto impacto. Em cursos ao vivo e 100% online, você domina a nova era da IA em tempo real.
Aulas ao vivo
Saiba mais
Agentic Engineering: orquestre multiplos agentes com confiabilidade
Building AI Products: transforme ideias em produtos reais com IA
AI Data Strategy: transforme dados em decisões estratégicas com IA
Escolha seu Plano
Plus 2438% OFF
Pro 2438% OFF
Ultra Lab 2438% OFF
Eventos Alura
Nossos eventos são pensados para quem quer estar à frente das mudanças em tecnologia, IA e inovação. Em experiências presenciais, você acompanha tendências e se conecta com especialistas que estão moldando o futuro.
Próximos eventos
IA Conference
Alura Signals
Talent Lab
IA
Artigos
Para Empresas

Links principais

Planos e Promoções

Carreiras

Especialista em IA
Engenharia de IA
Ai native software engineering
Arquitetura de Soluções com IA
AI Product Design
Engenharia de Machine Learning
Desenvolvimento Front-End React
Engenharia de Dados
Cloud Security
Social Media Marketing
Engenharia de Agentes de IA

Entrar Ver Planos

Área de Interesse

Entrar Ver Planos

Aulas ao Vivo - Skills & Go

Agentic Engineering: orquestre multiplos agentes com confiabilidade
Building AI Products: transforme ideias em produtos reais com IA
AI Data Strategy: transforme dados em decisões estratégicas com IA

Entrar Ver Planos

Senioridade

Entrar Ver Planos

Eventos Alura

IA Conference
Alura Signals

Entrar Ver Planos

Links complementares do menu mobile

Inteligência Artificial

Pós Graduações

Busca:

Home
Carreiras
Skills & Go
Talent Lab
Inteligência Artificial
Pós Graduações
Artigos
Sobre a Alura
Grupo Alun

Busca:

Plano Pro 24
Plano Plus 24
Plano Ultra Lab 24

LinkedIn
Instagram
YouTube

Página inicial
Dados
O que é Ciências de Dados?

O que é Ciências de Dados?

11 minutos de leitura

11 minutos de leitura

Introdução
Entendendo a Ciência de Dados e aplicações
O que é análise exploratória?
O que é Causa e Correlação?
Como nasceu o termo Ciências de Dados?
O guarda-chuva da Ciências de Dados
Python é o novo Excel?
Linguagens e bibliotecas de Data Science: R, Python, Pandas

Autor(a)

Paulo Silveira

Paulo Silveira é CEO e cofundador da Alura. Bacharel e mestre em Ciência da Computação pela USP, teve sua carreira de formação em PHP, Java e nas maratonas de programação. Criou o Guj.com.br, o podcast do Hipsters.tech e o Like a Boss.

Inscreva-se em nossa Newsletter

Fique por dentro de conteúdos, insights e oportunidades do universo tech. Receba novidades e lançamentos direto no seu e-mail.

E-mail

Li e concordo com os Termos de Uso e Política de Privacidade

O que faz uma pessoa cientista de dados?

Quais as profissões em Ciência de Dados?

Por onde começar e seguir carreira na área de Dados?

Introdução

https://www.youtube.com/watch?v=5b9Z8toVaAU

Capítulos:
- 00:00 - 01:55 - O que é data science ou ciência de dados?
- 01:55 - 03:08 - O que é análise exploratória?
- 03:08 - 04:10 - Exemplo real de análise exploratória
- 04:10 - 05:23 - O que é Causa e Correlação?
- 05:23 - 06:40 - Como nasceu o data science?
- 06:40 - 07:07 - A bolha da ciência de dados
- 07:07 - 07:25 - Python é o novo excel?
- 07:25 - 09:24 - Linguagens e bibliotecas: R, Python e Pandas

Estude 2 anos por R$ 158/mês. Planos com até 35% OFF. Ver planos.

Avalie este artigo

Publicado: 18/09/2022

Explore por tópico

Mobile
Back-end
Front-end
DevOps
UX & Design
Dados
Gestão & Negócios
Inteligência Artificial

Banner da Alura convidando profissionais a desenvolver habilidades em inteligência artificial para acompanhar as transformações do mercado de tecnologia. A campanha destaca que quem utiliza IA produz mais, cresce na carreira e se torna mais competitivo, reforçando que a inteligência artificial deixou de ser tendência e passou a ser uma habilidade essencial. O banner incentiva a começar a aprender IA com os cursos da Alura e impulsionar a transformação digital.

Entendendo a Ciência de Dados e aplicações

PAULO SILVEIRA:

A primeira coisa que eu quero saber nesse episódio é: afinal, o que é Ciência de Dados? Guilherme, você pode dar um exemplo para a gente entender?

GUILHERME SILVEIRA:

Hoje em dia, quando a gente fala da ciência de dados, pensa num guarda-chuva que inclui muitas coisas. Então vou dar um exemplo de uma parte disso que a gente costuma chamar de ciências de dados.

E a ideia é, pensa numa empresa que vende sorvete ou outros objetos gelados que a gente gosta de tomar, né? — em momentos, principalmente, quentes — e quando você começa a analisar as vendas mensais ou diárias e do lado desses números você coloca a temperatura do dia ou a temperatura média do mês, você pode perceber que existe uma relação ou, mais especificamente, uma correlação entre esses dois valores, essas duas sequências de valores.

Quando a temperatura é mais alta tem mais consumo de sorvete, mais baixa tem menos consumo, elas crescem juntas.

Gráfico que mostra a relação entre o consumo de sorvete e a temperatura do dia.

Ou ainda outras variáveis, você olha a variável “se o tempo está nublado” ou “se choveu" e percebe que é ao contrário a correlação. Quando chove tem menos consumo. E você pode encontrar esse tipo de comportamento que não necessariamente é uma relação de causa, mas uma correlação que existe entre esses números.

PAULO SILVEIRA:

O que pode trazer alguma dica ou algum sinal de que você deve investigar mais.

GUILHERME SILVEIRA:

Isso! Até, por exemplo, se eu sei que a previsão do tempo no mês que vem vai tá muito quente, então é bom eu produzir muito sorvete, agora se no mês que vem não vai estar tão quente, não faz sentido fazer tanto estoque, porque eu não vou vender e distribuir tanto sorvete assim.

Estou citando o ramo de sorvetes, mas no ramo da moda isso é super tradicional, o ciclo de produção da moda é muito longo, então para o verão que vem já preciso ter uma ideia de quanto eu vou vender para poder a fábrica produzir essa quantidade específica de saia e bermuda etc, que são uma roupas do verão, por exemplo.

Data Science, Corporações e Sociedade – Hipsters Ponto Tech #250

spotify:5JI9mJov3WpvKrsKcVvVVD:episode

O que é análise exploratória?

PAULO SILVEIRA:

Esse tipo de pergunta que você está fazendo “ah, será que vende mais ou vende menos sorvete de acordo com a temperatura?”, o que parece meio óbvio, eu posso tentar correlacionar com outros tipos de variáveis que às vezes a gente nem imagina, correto?

Então, parece que a pessoa cientista de dados lida com uma pergunta que ela não sabe exatamente o que está procurando. Isso tem a ver com esse nome que se usa bastante, análise exploratória?

Imagem do Paulo Silveira perguntando o que é análise exploratória.

GUILHERME SILVEIRA:

Esse termo foi cunhado bem recentemente, aliás, sabe? Menos de um século, há 50 anos atrás. Para definir e separar duas partes nos estudos dos dados, porque uma parte é realmente testar uma teoria que eu tenho, uma hipótese, que eu quero ver se é verdadeira. Então se eu tenho uma teoria que é quando faz calor vende mais, eu posso fazer um teste para isso, ou outras coisas, por exemplo, a teoria de que um remédio cura gripe e, então, faço um teste para isso.

Então isso é uma fase em que eu posso trabalhar, mas antes disso você pode ter uma outra fase que é simplesmente olhar os dados, ver o que que você encontra por lá e essa é a fase de análise exploratória. Com isso, você pode encontrar diversas coisas que nem espera, levantar perguntas baseadas nos dados que você olhou e depois que levantou todas as perguntas, intuições, hipóteses, você coloca elas em teste, cria modelos e faz outras coisas.

Exemplo real de análise exploratória

PAULO SILVEIRA:

Acho que você tem outro exemplo interessante que trouxe para a gente.

GUILHERME SILVEIRA:

Tem um outro exemplo, que é de onde eu trabalho, uma Escola online, a Alura, e lá dentro a gente tem diversos cursos e diversas pessoas.

As pessoas fazem cursos e estudam, mas como é online e pode usar a qualquer hora, tem gente que estuda 1 vez por semana, 2 vezes por semana, 3 vezes por semana, de vez em quando, de vez em nunca, com ritmo ou sem ritmo, tem tudo. E, se você olhar os dados, uma das coisas que você percebe é que quem visita duas vezes por semana ou mais (a plataforma), tem uma taxa de conclusão de cursos a curto, médio e longo prazo totalmente diferente de quem visita num ritmo menor.

O que me lembram um pouco o cursinho de inglês que a gente faz quando é criança, você vai lá de segunda e quarta ou de terça e quinta, não é simplesmente vai quando você quer, no horário que for, e ponto final. Ter um ritmo faz você manter aquele trabalho a médio-longo prazo, então a gente vê uma correlação entre você ter ritmo com um objetivo a médio-longo prazo de concluir diversos estudos.

Agora se isso é uma consequência, uma relação de causa ou é só uma correlação a gente tem que fazer algum teste para poder ter essa certeza.

Guia do Iniciante em Data Science – Hipsters Ponto Tech #221

spotify:5i9WWlTRDQX6QQp4BaB4b7:episode

O que é Causa e Correlação?

PAULO SILVEIRA:

Às vezes só ser a correlação é um sinal bom para a gente pensar “olha como instituição de ensino, vamos tentar engajar as pessoas a usarem mais a plataforma, porque elas vão concluir e ter um melhor aproveitamento” ou a gente acha, é uma hipótese.

Imagem com o Guilherme Silveira explicando o porquê correlação não é igual a causalidade.

GUILHERME SILVEIRA:

Com certeza, existe uma frase famosa, que obviamente eu não lembro de cabeça, que diz que a correlação não é causalidade, mas é um bom indício. Apesar que se você for procurar, tem um livro chamado spurious correlations.

PAULO SILVEIRA:

É um livro ou aquele site? Tem um site (spurious correlations).

GUILHERME SILVEIRA:

O site que tem um livro, eu acho que o livro é do mesmo nome e tem exemplos super legais de correlações super interessantes, por exemplo, os anos que a bolsa dos Estados Unidos subiu com relação aos anos que o Nicolas Cage lançou o filme.

PAULO SILVEIRA:

E ela (correlação) segue direitinha a curva!

Imagem do site sporious correlations que mostra uma correlação entre a bolsa dos EUA e lançamentos do filmes do Nicolas Cage.

GUILHERME SILVEIRA:

O gráfico é igualzinho nos dois. Então tem uma correlação, a gente sabe obviamente que essa correlação não faz sentido, mas existe. Então tem que tomar sempre muito cuidado com como a gente analisa os dados, porque a gente pode cometer diversos tipos de erros que trazem conclusões que não fazem sentido.

Como nasceu o termo Ciências de Dados?

PAULO SILVEIRA:

Então porque que nasceu esse termo ciência de dados, sendo que eu acho que isso tudo que você está me contando parece muito com o que as pessoas faziam no Excel, numa planilha e que antigamente tinha uns nomes mais pomposos, como Business intelligence ou até Data Mining, o que aconteceu que nos últimos anos para cá isso estourou com esse termo de ciência de dados e não com o tal do Business intelligence ou Data Mining.

GUILHERME SILVEIRA:

A Inteligência Artificial, Machine Learning e a Ciência de Dados são realmente termos que trouxeram muita força para algumas coisas que as pessoas já faziam, então o pessoal de Analytics, Análise de Risco, muita gente que estudou Física, Oceanografia, Matemática, algumas das Engenharias etc, diversas áreas diferentes já utilizavam esses tipos de técnicas para criar modelos, para testar, para avaliar, para entender uma empresa ou uma situação, tudo isso já era utilizado com diversos nomes diferentes, com especificidades diferentes.

Guilherme Silveira explicando como nasceu a ciências de dados e sua relação com outras áreas como a inteligência artificial e o machine learning.

Mas com esse advento cada vez mais forte seja da linguagem Python, Machine Learning, Redes Neurais etc, acabou sendo cunhado alguns termos que o mundo do mercado pegou.

O guarda-chuva da Ciências de Dados

Grafo 3D em formato de esfera representando o guarda-chuva ou o universo do que hoje é chamdo de Ci~encias de dados, com nele contido os seguintes campos: machine learning, redes neurais, testes de controle randomizados, linguagens de programação, big data e clustering.

GUILHERME SILVEIRA:

Então o guarda-chuva (o universo) mais genérico ficou sendo esse de ciência de dados, então meio que: está ligado com dados? Está dentro do guarda-chuva de ciência de dados.

Então são coisas que já eram feitas, podiam ser feitas em Excel, muita gente usa Excel para fazer várias dessas coisas, ainda hoje em dia, mas também existe uma migração do pessoal do Excel indo para o Python ou indo para o R ou o pessoal que já era do R (estão migrando também), tem tudo isso acontecendo.

Primeiros Passos em Data Science: Do Excel e BI ao Python – Hipsters #134

spotify:17FZ1Dny1y9cCGjyg4eYcy:episode

Websérie: Universo Data Science

Data Science: por onde eu começo? | Universo Data Science #01

https://www.youtube.com/watch?v=K-eaT4V8j-w&list=PLh2Y_pKOa4UcNJzv9IXUAihhCVv7YkyKQ&index=1

Acesse: Universo Data Science | Alura

Python é o novo Excel?

PAULO SILVEIRA:

Pois é, twittei recentemente a piada de um colega, que o Python é o novo Excel, faz sentido?

Guilherme Silveira explicando se o python é novo excel.

GUILHERME SILVEIRA:

Talvez né, porque eu acho o Excel ainda mais amigável para o usuário final, por mais que fazer fórmulas, uma dentro da outra etc, não seja nada trivial né, a maneira funcional e reativa do Excel, não é trivial, mas eu ainda ainda acho que o Excel é mais tranquilo de aprender a primeira vez.

Linguagens e bibliotecas de Data Science: R, Python, Pandas

Paulo Silveira questionando sobre as novas ferramentas de ciências de dados, como python,R e a biblioteca Pandas.

PAULO SILVEIRA:

E onde que entra então, essas siglas, essas palavras-chaves, Python, R e Pandas que estão muito no dia a dia do(a) cientista de dados?

GUILHERME SILVEIRA:

Então, existe o Excel que é uma forma da gente trabalhar os dados numa planilha e, que eu acho super legal, porque é fácil da gente visualizar essas informações, mas a gente também pode descrever isso de uma maneira que a gente manda o computador fazer coisas, (de maneira) imperativa, que em geral imperativo é o que a gente acaba usando nessas outras linguagens, e com isso você tem o Python, o R e outras linguagens como alternativas ao Excel, existem outras ferramentas também, claro né.

Então você vai ter, talvez mais controle, talvez (com a possibilidade de) fazer coisas mais profundas, com mais facilidade e vai ter uma luta de linguagens um pouco, mas são alternativas, o Excel, o R, o Python, cada uma com suas vantagens e desvantagens.

Dentro do mundo do Python, você vai ter, por exemplo, o Pandas como uma biblioteca que basicamente todo mundo utiliza, o Jupyter basicamente como espaço de exploração para fazer testes, com espaço exploratório. Mas se você correr atrás, você vai ver gente usando o mesmo Jupyter, não só para fazer um teste, mas para rodar coisas para valer mesmo, como o Netflix que usa um cluster de Jupyter rodando os algoritmos deles de machine learning.

Então você pode usar essas ferramentas para fazer outras coisas, se você tem o Pandas como a principal, provavelmente, biblioteca de Python, tem Numpy também, mas é mais numérico, mas o pandas é a principal biblioteca de uma dessas linguagens.

O que faz uma pessoa cientista de dados?

O que faz uma Cientista de Dados? com Mikaeri Ohana | #HipstersPontoTube

https://www.youtube.com/watch?v=Zwvq-rlIHAw

Quais as profissões em Ciência de Dados?

Quais as profissões em Ciência de Dados? com Mikaeri Ohana | #HipstersPontoTube

https://www.youtube.com/watch?v=5CHLH9LU1Uc

Por onde começar e seguir carreira na área de Dados?

Veja os caminhos para começar na área de Ciências de Dados, com cursos e formações que a Escola de Dados da Alura preparou para você, que passa por todo esse universo:

SQL e Banco de Dados;
Data Science;
Estatística;
Machine Learning;
Business Intelligence;
Excel;
NoSQL;
Engenharia de Dados;
Data Visualization.

Acesse: Por onde começar os estudos na área de dados?

Carreira em Dados – Hipsters Ponto Tech #273 - Hipsters Ponto Tech

spotify:3iKJS81bvSoWDACEr4OLFo:episode

Como fazer um portfólio em tecnologia?

Como fazer um bom portfólio em tecnologia com Diogo Pires | #HipstersPontoTube

https://www.youtube.com/watch?v=gu1OXrirC0U

Cibersegurança

Leia também

21/01/2021
Modelos matemáticos utilizados em séries temporais
Ler mais
19/01/2023
Engenharia de Dados: o que é, o que faz um engenheiro de dados e Guia Completo (Big Data, carreira, exemplos e como começar)
Ler mais
05/08/2024
Governança de dados: o que é e dicas de como fazer
Ler mais

Ver mais conteúdos

O que é Ciências de Dados? | Alura Cursos Online