Olá!
Talvez já tenhamos ouvido falar que, para trabalhar com dados, é necessário saber programar, construir modelos e também entender estatística. E tudo isso é verdade. No entanto, o que muitas pessoas esquecem é que, por trás dessas ferramentas, existe uma base matemática sólida que sustenta todas as análises, decisões e também algoritmos de Machine Learning (aprendizado de máquina).
Este curso foi construído para nos ajudar a desenvolver essa base de forma estruturada e contextualizada. Ao longo das aulas, vamos revisar os principais conceitos matemáticos que se aplicam diretamente no dia a dia de quem trabalha com dados.
Neste curso, abordaremos desde conceitos mais simples, como operações fundamentais, frações, porcentagem e lógica, até conceitos mais avançados, como funções, álgebra linear e cálculo. Sempre conectaremos esses conceitos com a ciência de dados.
O curso não exigirá conhecimento prévio avançado nem a utilização de linguagem de programação. Nosso foco não é formar matemáticos, mas sim desenvolver nossa intuição matemática, clareza de raciocínio e conceitos que proporcionarão maior segurança para avançarmos em áreas de Machine Learning (aprendizado de máquina).
Audiodescrição: João é um homem branco, com cabelo e barba curtos, e está vestindo uma camisa azul.
João é matemático, trabalha como cientista de dados e também é instrutor na Alura.
Vamos começar?
Em ciência de dados, utilizamos números para representar proporções, frequências, taxas e partes de um conjunto de dados. Por isso, entender frações e números decimais é essencial desde os primeiros passos. Eles aparecem em gráficos, dashboards, análises estatísticas e até mesmo na avaliação de modelos de machine learning. O primeiro tema que vamos abordar são frações e números decimais.
Vamos entender esse conceito a partir da definição de fração. Uma fração representa a parte de um todo e pode ser representada por uma divisão. Acima da barra que define a fração, colocamos um número P
e, abaixo dessa barra, um número Q
. A fração é a divisão desse número inteiro P
por esse número inteiro Q
. Podemos dar um nome para cada um desses números: o número que fica acima da fração é chamado de numerador, e o número abaixo da barra é chamado de denominador. A única exceção é que no denominador o valor não pode ser igual a zero, pois na matemática não existe divisão por zero.
Agora, vamos entender esse conceito a partir de um exemplo do mundo real. Em uma tabela, há um total de 200 clientes, e 150 deles realizam um pagamento usando cartão de crédito. Como podemos representar a fração desses clientes, ou seja, como podemos representar a parte desse total de 200 clientes? Primeiro, pegamos o valor de 150, que é a quantidade de clientes que fazem o pagamento usando cartão de crédito, e dividimos pelo valor 200. Assim, obtemos a fração dessas pessoas que realizam o pagamento com cartão de crédito nessa base de dados.
Agora que entendemos o conceito de fração, podemos entender o conceito de equivalência de frações. Uma fração é uma divisão, e essa divisão pode ser feita por diversos números. Um número dividido por outro resultará em um valor decimal. Se pegarmos outro número e dividirmos por outro, pode ser que obtenhamos o mesmo valor. A equivalência de frações é exatamente isso: podemos representar a mesma fração de diversas formas. Por exemplo, a fração 150 por 200, se fizermos a mesma operação no numerador e no denominador ao mesmo tempo, podemos obter outra fração que tem o mesmo resultado de divisão. No caso de 150 dividido por 200, se realizarmos a divisão do numerador e do denominador pelo número 2, encontramos a fração 75 dividido por 100. Esse resultado tem o mesmo valor que a anterior, e podemos continuar esse processo. A fração 75 por 100, se dividirmos novamente, obtemos 15 dividido por 20, que é equivalente a 3 quartos. Essa é a menor fração que pode representar essa divisão por números inteiros, pois não existe um número inteiro menor no numerador e no denominador que permita simplificar a fração.
Da mesma forma, podemos pegar a fração 150 por 200 e multiplicar o numerador e o denominador pelos mesmos valores. Se multiplicarmos tanto o numerador quanto o denominador pelo valor 2, obtemos a fração 300 por 400. Se multiplicarmos 150 por 200 vezes 3, obtemos 450 por 600, e assim sucessivamente. É interessante entender essa equivalência de frações, pois frações escritas de forma diferente podem resultar no mesmo valor de divisão.
Agora, vamos entender o processo de conversão para decimal. Como a fração é uma divisão, podemos obter um número decimal, que contém uma parte inteira, uma vírgula e uma parte fracionária. A divisão de 150 por 200 pode ser feita manualmente. Escrevemos 150 dividido por 200. Para realizar essa divisão, acrescentamos um zero ao 150, tornando-se 1.500 dividido por 200. Colocamos um zero e uma vírgula. O primeiro valor que colocamos é 7, e obtemos como resultado da multiplicação de 7 por 200 o valor 1.400, sobrando como resto 100. Colocamos novamente um zero para continuar a operação e obtemos o valor 5. Multiplicando 5 por 200, zeramos o resto, o que significa que a fração 150 por 200 tem como valor decimal 0,75. Todas as frações equivalentes que vimos anteriormente terão o mesmo resultado decimal, que é 0,75. Assim, podemos representar que 150 dividido por 200 resulta em 0,75.
Agora, vamos entender quais operações podemos realizar com frações. A primeira operação é a soma e subtração, que seguem o mesmo processo. Se temos duas frações A
sobre B
e C
sobre D
, para somá-las, primeiro precisamos obter uma fração com o mesmo denominador. Precisamos encontrar um denominador comum entre as frações e, em seguida, somar os valores proporcionais na parte superior da fração. Uma forma simples de obter o mesmo denominador é multiplicar os denominadores. Assim, B
vezes D
resulta no denominador, e na parte superior da fração, o numerador, fica na fórmula A
vezes D
mais B
sobre C
. Isso representa o resultado proporcional daquela fração em relação ao denominador comum encontrado. Quando multiplicamos B
vezes D
e somamos o resultado no numerador, precisamos dividir B
vezes D
por B
, resultando em D
, e multiplicar pela parte superior, vezes A
.
Fica A
vezes D
mais o resultado de B
vezes C
, que seria B
vezes D
, dividido por D
, resultando em B
. Multiplicamos B
pelo numerador, resultando em B
vezes C
. Este é o resultado da soma de frações. A subtração segue o mesmo princípio, apenas trocando o sinal de mais por menos, resultando em A
vezes D
menos B
vezes C
, tudo isso dividido por B
vezes D
.
Vamos entender isso com um exemplo. Em uma tabela contendo reviews de clientes, temos a seguinte classificação: dois quintos dos reviews são positivos, um terço são neutros, e o restante são negativos. Qual é a fração dos reviews que é negativa? Para encontrar isso, precisamos somar dois quintos com um terço para determinar o total de reviews positivos e neutros. O restante, ou seja, a subtração do total menos essa soma, será a quantidade de reviews negativas.
Vamos fazer por partes. Primeiro, somamos dois quintos com um terço. Precisamos identificar a fração de reviews que não são negativas, ou seja, positivas ou neutras. Para isso, multiplicamos os denominadores das frações: 5 vezes 3 resulta em 15. Representamos o denominador como 5 vezes 3. No numerador, multiplicamos 5 vezes 3, dividimos pelo valor 5 do denominador da primeira fração e multiplicamos pela parte superior. Assim, 5 vezes 3 dividido por 5 resulta em 3. Multiplicamos 3 por 2 no numerador, obtendo 2 vezes 3. Somamos com a outra fração: 5 vezes 3 dividido por 3 resulta em 5. Multiplicamos 5 por 1, que é o numerador, obtendo 1 vezes 5. Realizando essas operações, encontramos 6 mais 5, dividido por 15, resultando na fração 11 sobre 15, que representa a parte do total de pessoas com review positiva ou neutra.
Para encontrar a parte de reviews negativas, pegamos 1, que é o total. A fração 11 sobre 15 é menor que 1. Assim, pegamos o total, que é 15 sobre 15, ou 1, e subtraímos 11 sobre 15. Primeiro, igualamos o denominador, representando a fração como 1 sobre 1. Multiplicamos 1 vezes 15 no denominador, dividimos por 1, resultando em 15, e multiplicamos pelo numerador, que é 1, obtendo 1 vezes 15. Subtraímos o resultado dessa multiplicação, dividido por 15, que é 1, vezes 11 no numerador, resultando em 11 vezes 1. Realizando essa operação, obtemos 4 sobre 15. Se considerarmos que o total de reviews são 15 partes, podemos dividir em 4 partes iguais para reviews negativas e 11 partes iguais para reviews positivas ou neutras. Assim, entendemos o conceito de fração.
Após entender a operação de soma de frações, podemos abordar a multiplicação de frações, que é mais simples do que a soma e subtração. A multiplicação de uma fração A
sobre B
por C
sobre D
é direta: A
vezes C
resulta no numerador da nova fração, e B
vezes D
no denominador.
Vamos entender isso com um exemplo. Em uma campanha de marketing, quatro quintos das pessoas abriram um e-mail, e um quarto dessas pessoas clicaram no link da campanha. Qual é a fração das pessoas que acessaram o link? Precisamos multiplicar as pessoas que abriram o e-mail pelas que clicaram no link. Assim, obtemos a parte do total de pessoas que acessaram o link. Multiplicamos 4 sobre 5 por 1 sobre 4. A multiplicação é direta: 4 vezes 1 no numerador e 5 vezes 4, que dá 20 no denominador. Podemos simplificar essa fração. Dividindo por 4, tanto no numerador quanto no denominador, obtemos 1 quinto. Assim, 1 quinto das pessoas acessaram o link.
Agora, vamos entender o conceito de divisão de fração. Para dividir uma fração A
sobre B
por C
sobre D
, mantemos a primeira fração, A
sobre B
, e multiplicamos pelo inverso da segunda fração. O inverso é trocar a posição do numerador pelo denominador, resultando em A
sobre B
vezes D
sobre C
.
Vamos entender isso com um exemplo. Em uma empresa de varejo, cada loja consome três quartos de um palete de produtos por semana, e um caminhão transporta metade de um palete por viagem. Quantas viagens de caminhão são necessárias por loja por semana? Precisamos pegar três quartos de um palete e dividir por meio palete por viagem. Mantemos a primeira fração, três quartos, e multiplicamos pela segunda fração invertida, trocando a posição do numerador com o denominador. Assim, temos 3 vezes 2 e 4 vezes 1, resultando na fração 6 sobre 4, que é equivalente a 3 sobre 2. Isso equivale a 1,5 em número decimal. Portanto, são necessárias 1,5 viagens por loja por semana para transportar esses paletes de produtos.
Com isso, entendemos todas as operações que podemos realizar com frações, o conceito dessas frações e como isso se conecta com as ideias da ciência de dados. No próximo vídeo, continuaremos com esses conceitos, começando com os mais simples e avançando para os mais complexos.
Agora que entendemos o conceito e a definição de fração e as operações que podemos realizar com ela, chegou o momento de compreendermos também a definição e o conceito de porcentagem. A porcentagem é uma ferramenta extremamente útil quando estamos analisando dados, podendo aparecer de diversas formas, como em relatórios ou diretamente em uma base de dados. Quando avaliamos o desempenho de um modelo, por exemplo, métricas em porcentagem são frequentemente utilizadas, especialmente em ciências de dados.
Vamos começar com a definição de porcentagem. A porcentagem é uma medida de razão com base 100. Literalmente, porcentagem significa "por 100", ou seja, uma divisão de um resultado por 100. A porcentagem nada mais é do que uma fração. Quando indicamos x%, estamos dizendo x dividido por 100, sendo essa uma fração onde o denominador é sempre 100.
Vamos entender como podemos fazer a conversão de uma porcentagem para um número decimal e vice-versa. É importante termos essa ideia clara de que, ao trabalharmos com um número em porcentagem, podemos ter esse mesmo número em decimal e, assim, compreender que se trata de uma porcentagem. Por exemplo, 5% equivale a 5 dividido por 100, resultando em 0,05. Portanto, sempre que vemos o valor 0,05, é o mesmo que 5%. Da mesma forma, 67% é equivalente a 0,67. Essa transformação facilita a interpretação dos dados, pois quando temos valores em decimal, sabemos que também são valores percentuais.
Quando temos a porcentagem de um valor, podemos determinar a proporção desse valor a partir da porcentagem. Por exemplo, ao calcularmos 10% do total ou 25% de um determinado valor, estamos tentando entender a proporção, ou seja, a fração daquele todo. A porcentagem é muito útil para avaliar essa proporção de um valor fixo ou de uma quantidade de dados.
Vamos entender a porcentagem de 50% de um valor literal de 250. Isso significa que estamos querendo entender uma parte de um todo desse valor de 250. Qual é o valor de 50% desse 250? Para fazer isso, podemos multiplicar 50% por 250, ou seja, 50 sobre 100 vezes 250, que é o mesmo que 0,5 vezes 250, resultando em 125. A interpretação fica ainda mais clara quando entendemos que 50% é o mesmo que 1 sobre 2, ou seja, metade do valor. Quando já temos isso em mente, sabemos que 50% representa a metade desse valor.
Vamos entender isso a partir de um exemplo. Em uma base de dados de um e-commerce, houve um total de vendas de 60 mil em um único mês, e a categoria de eletrônicos corresponde a 30% da receita do mês. Qual é o valor em reais dessa categoria de eletrônicos? Ou seja, do total de 60 mil no mês, queremos saber a proporção referente à categoria de eletrônicos. Para isso, calculamos 30% dos 60 mil, multiplicando 0,30 por 60 mil. Ao fazer essa multiplicação, obtemos que 30% dos 60 mil equivale a 18 mil reais. Assim, conseguimos compreender que essa proporção, representada pela porcentagem, é muito útil para avaliar a fração do todo.
A porcentagem também pode ser utilizada em aumentos e reduções. Quando avaliamos que um determinado valor aumentou em 10%, caiu em 10% ou aumentou em 35%, o que isso significa? Podemos utilizar a porcentagem para avaliar esse aumento de forma relativa, permitindo inclusive comparar aumentos de coisas diferentes. Por exemplo, se em determinado momento um valor aumentou de 1.000 para 2.000, enquanto outro valor aumentou de 100 para 300, parece que o aumento de 1.000 para 2.000 foi maior, pois aumentou em 1.000 unidades. No entanto, ao avaliarmos em proporção, em porcentagem, o aumento de 1.000 para 2.000 foi o dobro, enquanto o de 100 para 300 foi o triplo. A porcentagem ajuda nesse sentido, permitindo avaliar a proporção desse aumento.
Para calcular esse aumento, subtraímos o valor antigo do valor mais recente e dividimos pelo valor antigo. Vamos tomar um exemplo para entender melhor esse aumento e redução.
Em uma base de dados de Churn, houve um aumento de 800 para 1.000 clientes que cancelaram o serviço. Qual foi o aumento percentual? Para calcular isso, pegamos o valor antigo, que é 800, e o valor mais recente, que é 1.000, e utilizamos a fórmula apropriada. Subtraímos o valor antigo do valor mais recente (1.000 - 800) e dividimos pelo valor antigo (800). Isso resulta em 200 sobre 800, o que significa um aumento de 0,25 ou 25%. Com isso, conseguimos interpretar essa informação de forma mais clara e precisa, pois não apenas sabemos que houve um aumento de 200 clientes, mas também que o aumento foi de 25%. Isso facilita a comparação com outras grandezas.
As aplicações em Ciência de Dados, ou Data Science, das porcentagens incluem a interpretação de dados, métricas de desempenho de modelos, análise gráfica e distribuição de dados. A porcentagem é utilizada em diversas análises que realizamos em Ciência de Dados. Vamos ver mais exemplos para entender ainda melhor essa porcentagem.
Após treinar um modelo de classificação com Machine Learning, foi feita a previsão nos dados, e o modelo conseguiu classificar 11.960 registros de um total de 13.000 dados. Qual foi a taxa de acerto do modelo? Para entender a taxa de acerto, calculamos a proporção de acertos dividindo a quantidade de dados que o modelo acertou (11.960) pelo total (13.000). Isso resulta em 0,92 ou 92%. A porcentagem nos ajuda a entender que esse modelo, na maior parte dos casos, acerta 92% das vezes. Isso indica que, a cada 100 tentativas, ele acerta 92%. Dessa forma, é mais fácil entender o desempenho do modelo. Se compararmos com outro modelo que utiliza mais dados, por exemplo, 15.000 dados, e acerta 12.000, a porcentagem nos permite avaliar e comparar esses resultados.
Vamos ver mais um exemplo. Em uma base de dados, após obter a distribuição da contagem da variável de forma de pagamento, obtivemos o seguinte: 500 pessoas pagam com cartão de crédito, 300 com boleto, 250 com cartão de débito e 150 com cheque. Para criar uma visualização e entender melhor essa proporção de clientes, podemos utilizar um gráfico de barras ou um gráfico de pizza, que nos permite avaliar as porcentagens de cada categoria. O primeiro passo é encontrar o total de registros da forma de pagamento, somando cada um dos valores: 500 + 300 + 250 + 150, totalizando 1.200. Cada um desses valores equivale a uma porcentagem diferente. Por exemplo, 500 sobre 1.200 equivale à porcentagem de pessoas que pagam com cartão de crédito. Da mesma forma, 300 sobre 1.200 equivale ao percentual de pessoas que pagam com boleto, e assim por diante. Fazendo essas divisões, obtemos: cartão de crédito 41,7%, boleto 25%, cartão de débito 20,8% e cheque 12,5%. Ao somar essas porcentagens, sempre obtemos 100%, pois 100% é o total. Podemos representar isso em um gráfico de pizza ou de barras. Aqui, mostramos um exemplo de gráfico de pizza. Representar os valores em porcentagem torna mais claro entender a proporção e a área de cada informação.
A porcentagem, como vimos, tem definições e aplicações que podemos utilizar dentro da Ciência de Dados. No próximo vídeo, continuaremos avançando em mais conceitos matemáticos que nos ajudam a entender melhor nossos dados.
O curso Matemática para Data Science: construindo a base possui 278 minutos de vídeos, em um total de 49 atividades. Gostou? Conheça nossos outros cursos de Data Science em Data Science, ou leia nossos artigos de Data Science.
Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:
Impulsione a sua carreira com os melhores cursos e faça parte da maior comunidade tech.
1 ano de Alura
Assine o PLUS e garanta:
Formações com mais de 1500 cursos atualizados e novos lançamentos semanais, em Programação, Inteligência Artificial, Front-end, UX & Design, Data Science, Mobile, DevOps e Inovação & Gestão.
A cada curso ou formação concluído, um novo certificado para turbinar seu currículo e LinkedIn.
No Discord, você participa de eventos exclusivos, pode tirar dúvidas em estudos colaborativos e ainda conta com mentorias em grupo com especialistas de diversas áreas.
Faça parte da maior comunidade Dev do país e crie conexões com mais de 120 mil pessoas no Discord.
Acesso ilimitado ao catálogo de Imersões da Alura para praticar conhecimentos em diferentes áreas.
Explore um universo de possibilidades na palma da sua mão. Baixe as aulas para assistir offline, onde e quando quiser.
Acelere o seu aprendizado com a IA da Alura e prepare-se para o mercado internacional.
1 ano de Alura
Todos os benefícios do PLUS e mais vantagens exclusivas:
Luri é nossa inteligência artificial que tira dúvidas, dá exemplos práticos, corrige exercícios e ajuda a mergulhar ainda mais durante as aulas. Você pode conversar com a Luri até 100 mensagens por semana.
Aprenda um novo idioma e expanda seus horizontes profissionais. Cursos de Inglês, Espanhol e Inglês para Devs, 100% focado em tecnologia.
Para estudantes ultra comprometidos atingirem seu objetivo mais rápido.
1 ano de Alura
Todos os benefícios do PRO e mais vantagens exclusivas:
Mensagens ilimitadas para estudar com a Luri, a IA da Alura, disponível 24hs para tirar suas dúvidas, dar exemplos práticos, corrigir exercícios e impulsionar seus estudos.
Envie imagens para a Luri e ela te ajuda a solucionar problemas, identificar erros, esclarecer gráficos, analisar design e muito mais.
Escolha os ebooks da Casa do Código, a editora da Alura, que apoiarão a sua jornada de aprendizado para sempre.
Conecte-se ao mercado com mentoria personalizada, vagas exclusivas e networking estratégico que impulsionam sua carreira tech para o próximo nível.