Artigos de Tecnologia e Negócios > Data Science

Google Colab: o que é e como usar?

Thiago G Santos
Thiago G Santos

Nesse artigo vamos entender o que é o Colab, como ele funciona, como abrir arquivos externos e como escrever códigos e textos em markdown. O Google Colaboratory, carinhosamente chamado de Colab, é um serviço de nuvem gratuito hospedado pelo Google para incentivar a pesquisa de Aprendizado de Máquina e Inteligência Artificial.

Agora que já temos uma introdução do que é o colab, vamos ver como usá-lo. Similar ao famoso jupyter notebook, o Colab é uma lista de células que podem conter textos explicativos ou códigos executáveis e suas respectivas saídas.

Como usar o Colab?

A primeira coisa que precisamos fazer para usar o google Colab é acessar o seguinte endereço:

https://colab.research.google.com/notebooks/intro.ipynb

Logo seremos direcionados para um notebook chamado Welcome to Colaboratory:

pagina inicial do colab

Esse notebook explica algumas características do Colab e mostra como dar os primeiros passos (recomendo a leitura). Algumas das principais características do Colab são:

Ok, já li e entendi o que é o Colaboratory, mas quero criar meu próprio notebook! Para fazer isso, precisamos clicar em >File, na parte superior esquerda, logo em seguida em >New Notebook. Veja figura abaixo:

pagina inicial do colab

Feito esse processo, caso não esteja logado em uma conta google, o seguinte pop-up aparece:

pagina inicial do colab

Clique em OK para ser direcionado à tela de login do gmail. Caso não tenha uma conta gmail, clique em Create account e siga os passos para cadastro:

pagina inicial do colab

Feito, agora você tem acesso ao seu google colab! Vamos fazer alguns teste nesse notebook!

Seu primeiro código no Colab.

Estando no seu notebook, quero explicar sobre os três pontos em destaques da seguinte imagem:

pagina inicial do colab

Vamos começar pelo recorte 01, aqui temos o que chamamos de célula. A célula é o local onde você escreve códigos ou texto. Vamos começar com a célula de código, que você pode ir testando aí no seu notebook. Então para começar digite em 01:

print(“Hello World”)

Para executar esse código temos algumas opções: você pode clicar no sinal de play que fica no início da célula ou pode usar o atalho SHIFT+ENTER (existem diversos outros atalhos para executar uma célula, você encontra detalhes neste documento).

Repare que ao executar, Hello World é impresso logo abaixo. Agora vamos tentar outro código, que tal realizarmos uma operação e armazenar esse valor em uma variável?! Use o seu notebook para executar o seguinte código:

soma_dois_numeros = 1232 + 2314

Ao executar, diferente da célula anterior, nada é impresso. Isso ocorre porque a atribuição de variáveis não tem retorno em python. Outro ponto que você deve ter observado é que ao rodar a primeira célula, o tempo para executar foi mais longo, isso porque, ao rodar pela primeira vez, o colab precisa criar uma máquina nos servidores do google, então esse tempo extra se dá justamente para a criação desta máquina.

Até o momento nós criamos apenas células de código, mas conforme falamos, os notebooks nos permitem mesclar essas células de código e textos em formato markdown. Na figura anterior temos o recorte 02, esses “botões” servem para adicionar novas células em seu notebook.

+Code adiciona células de código e +Text adiciona as células nas quais você pode digitar texto com as configurações markdown. Essa característica nos permite desenvolver explicações e relatórios nos próprios notebooks. Experimente aí no seu notebook, crie alguns textos em formato markdown!

Já sabemos como escrever códigos, o que será primordial ao realizar uma análise de dados. Também aprendemos que é possível escrever textos, o que nos ajuda a tecer conclusões e criar relatórios. Entretanto, para que o Colab se torne uma ferramenta funcional falta o principal elemento: a base de dados.

Temos várias formas de obter acesso a uma base de dados, entre elas utilizar alguma biblioteca que lê um arquivo direto de uma URI, por exemplo. Segue uma sugestão de como podemos ler o dataset MovieLeans salvo no github da Alura:

import pandas as pd
base_de_dados = pd.read_csv(“https://raw.githubusercontent.com/alura-cursos/formacao-data-science/master/movies.csv”)

Assim, temos o dataset salvo na variável base_de_dados e podemos realizar a exploração dos dados.

A forma que apresentamos é útil quando temos os dados públicos, mas muitas vezes a base de dados está em nosso computador e não podemos deixá-la disponível na internet. Como podemos fazer para enviar esses dados para o Colab?

No destaque 03, última figura, temos o ícone de uma pasta, clique nela. Veja na imagem abaixo que ao clicar, uma view é aberta, mostrando uma estrutura de diretórios.

pagina inicial do colab

Se você explorar as pastas, vai perceber que é muito similar à estrutura de um sistema operacional Linux.

Na parte superior da view temos algumas opções: se você clicar em input poderá optar por enviar um arquivo da sua máquina para o google. Desse modo, pode acessar a base de dados passando como parâmetro para a função pd.read() o local do arquivo, por exemplo:


base_de_dados = pd.read_csv(“base_de_dados_que_você_subiu.csv”)

A desvantagem desse método é que ao fechar e acessar seu notebook em outro momento, você precisa realizar o input dos dados novamente, processo que pode ser demorado. Outra maneira de acessar os dados é salvar em seu Drive e acessá-lo direto do notebook, para isso apenas clique em Mount Drive, que aparece na imagem anterior.

Conclusão

Vimos que usar o google colab torna nossa entrada na área de dados simples, afinal de contas não precisamos instalar nada, não precisamos realizar configurações e nem mesmo ter uma máquina poderosa. O google disponibiliza tudo isso pronto e com qualidade, é só acessar um notebook e começar a diversão!

Agora que você conhece as principais funcionalidades dos notebooks e sabe utilizar o colaboratory, que tal criar sua análise no colab e compartilhar com a gente nas redes sociais?

Gostou deste assunto e quer se aprofundar mais em ciência de dados, veja alguns cursos que a Alura tem nesta área:

Formação em Ciência de dados

Formação em Machine Learning

Curso de Deep Learning

Para se manter informado sobre nossas novidades, siga a Alura nas redes sociais. Se quiser conhecer mais e acompanhar diversos assuntos de ciência de dados me siga no Twitter @tgcsantos, sempre estou compartilhando conteúdos da área.

Artigos de Tecnologia e Negócios > Data Science

Cursos profissionais de Data Science é na Alura, comece agora!

  • 1222 cursos

    Cursos de programação, UX, agilidade, data science, transformação digital, mobile, front-end, marketing e infra.

  • Certificado de participação

    Certificado de que assistiu o curso e finalizou as atividades

  • App para Android e iPhone/iPad

    Estude até mesmo offline através das nossas apps Android e iOS em smartphones e tablets

  • Projeto avaliado pelos instrutores

    Projeto práticos para entrega e avaliação dos professores da Alura com certificado de aprovação diferenciado

  • Acesso à Alura Start

    Cursos de introdução a tecnologia através de games, apps e ciência

  • Acesso à Alura Língua

    Reforço online de inglês e espanhol para aprimorar seu conhecimento

Premium

  • 1222 cursos

    Cursos de programação, UX, agilidade, data science, transformação digital, mobile, front-end, marketing e infra.

  • Certificado de participação

    Certificado de que assistiu o curso e finalizou as atividades

  • App para Android e iPhone/iPad

    Estude até mesmo offline através das nossas apps Android e iOS em smartphones e tablets

  • Projeto avaliado pelos instrutores

    Projeto práticos para entrega e avaliação dos professores da Alura com certificado de aprovação diferenciado

  • Acesso à Alura Start

    Cursos de introdução a tecnologia através de games, apps e ciência

  • Acesso à Alura Língua

    Reforço online de inglês e espanhol para aprimorar seu conhecimento

12X
R$75
à vista R$900
Matricule-se

Premium Plus

  • 1222 cursos

    Cursos de programação, UX, agilidade, data science, transformação digital, mobile, front-end, marketing e infra.

  • Certificado de participação

    Certificado de que assistiu o curso e finalizou as atividades

  • App para Android e iPhone/iPad

    Estude até mesmo offline através das nossas apps Android e iOS em smartphones e tablets

  • Projeto avaliado pelos instrutores

    Projeto práticos para entrega e avaliação dos professores da Alura com certificado de aprovação diferenciado

  • Acesso à Alura Start

    Cursos de introdução a tecnologia através de games, apps e ciência

  • Acesso à Alura Língua

    Reforço online de inglês e espanhol para aprimorar seu conhecimento

12X
R$100
à vista R$1.200
Matricule-se

Max

  • 1222 cursos

    Cursos de programação, UX, agilidade, data science, transformação digital, mobile, front-end, marketing e infra.

  • Certificado de participação

    Certificado de que assistiu o curso e finalizou as atividades

  • App para Android e iPhone/iPad

    Estude até mesmo offline através das nossas apps Android e iOS em smartphones e tablets

  • Projeto avaliado pelos instrutores

    Projeto práticos para entrega e avaliação dos professores da Alura com certificado de aprovação diferenciado

  • Acesso à Alura Start

    Cursos de introdução a tecnologia através de games, apps e ciência

  • Acesso à Alura Língua

    Reforço online de inglês e espanhol para aprimorar seu conhecimento

12X
R$120
à vista R$1.440
Matricule-se
Procurando planos para empresas?

Acesso completo por 1 ano

Estude 24h/dia onde e quando quiser

Novos cursos todas as semanas