O que são estruturas de dados? Uma introdução a estruturas de dados e algoritmos na programação

Estrutura de dados é um dos principais pilares da programação. Junto com algoritmos, as estruturas de dados são fundamentais para organizar, acessar e manipular dados de forma eficiente em qualquer linguagem de programação.

Neste artigo, você vai entender o que é estrutura de dados, ver exemplos práticos, conhecer os principais tipos e descobrir por que aprender sobre estrutura de dados e algoritmos faz diferença na carreira de programação.

O que são dados na programação?

Os dados, em seus variados tipos, são os blocos básicos da programação. Representam unidades de informação que podem ser acessadas por meio de identificadores, como variáveis.

A maioria das linguagens de programação utiliza variações dos seguintes quatro tipos primitivos:

INT ou número inteiro: valores numéricos inteiros (positivos ou negativos);
FLOAT ou “ponto flutuante”: valores numéricos com casas decimais, positivos ou negativos;
BOOLEAN ou booleanos: representados apenas pelos valores “verdadeiro” e “falso”;
STRING: sequências ou cadeias de caracteres, usados para manipular textos ou outras informações não numéricas.

O JavaScript, por exemplo, tem como tipos primitivos embutidos na estrutura básica da linguagem: number, string, boolean e symbol (de “nome simbólico”, usado entre outras coisas para criar propriedades únicas em objetos).

Já o C# (C-Sharp) trabalha com uma quantidade maior de tipos primitivos, de acordo com o espaço de memória que será ocupado pela variável: Boolean, Byte, SByte, Int16, UInt16, Int32, UInt32, Int64, UInt64, IntPtr, UIntPtr, Char, Double e Single.

O C, por sua vez, não tem um tipo próprio de dado booleano; false é representado pelo número 0 e qualquer outro algarismo representa true. Outras linguagens podem trabalhar com outras variações.

O que é estrutura de dados em programação? Conceito e exemplos

Em computação, normalmente utilizamos os dados de forma conjunta.

A forma como estes dados serão agregados e organizados depende muito de como serão utilizados e processados, levando-se em consideração, por exemplo, a eficiência para buscas, o volume dos dados trabalhados, a complexidade da implementação e a forma como os dados se relacionam.

Estas diversas formas de organização são as chamadas estruturas de dados.

Podemos afirmar que um programa é composto de algoritmos e estruturas de dados, que juntos fazem com que o programa funcione como deve.

Cada estrutura de dados tem um conjunto de métodos próprios para realizar operações como:

Inserir ou excluir elementos;
Buscar e localizar elementos;
Ordenar (classificar) elementos de acordo com alguma ordem especificada.

Características das estruturas de dados

As estruturas de dados podem ser:

lineares (ex. arrays) ou não lineares (ex. grafos);
homogêneas (todos os dados que compõe a estrutura são do mesmo tipo) ou heterogêneas (podem conter dados de vários tipos);
estáticas (têm tamanho/capacidade de memória fixa) ou dinâmicas (podem expandir).

Há vários tipos de estruturas de dados, como as estruturas lineares (array, lista ligada, pilha, fila) e não lineares (árvore, grafo). Conheça as principais estruturas de dados e suas aplicações a seguir.

O que é array? Estrutura de dados array na prática

Também chamado de vetor, matriz ou arranjo, o array é a mais comum das estruturas de dados e normalmente é a primeira que estudamos.

Um array é uma lista ordenada de valores:

const listaNumeros = [4, 6, 2, 77, 1, 0]; 
const listaFrutas = ["banana", "maçã", "pera"];

Por ordenada, entenda-se aqui uma lista onde os valores sempre são acessados na mesma ordem. Ou seja, a não ser que seja utilizada alguma função ou método para alterar a ordem, o primeiro elemento do array listaNumeros sempre será 4, e o último, 0.

Em geral, arrays armazenam apenas um tipo de dado. Embora o JavaScript permita arrays de tipos mistos, como ["banana", 5, true], a maioria das linguagens restringe o array a um único tipo.

Por ser uma estrutura de dados básica e muitíssimo utilizada, a linguagens de programação costumam já ter este tipo implementado, com métodos nativos para criação e manipulação de arrays. No caso do JavaScript, você pode consultar os métodos e construtores de array no MDN.

Usos

Sendo a mais comum das estruturas, arrays são utilizados em praticamente toda situação que envolva organizar dados de um mesmo tipo; sejam dados recebidos por uma API ou enviados a uma base de dados, ou mesmo passado via parâmetro para uma função ou método.

Arrays também podem ser multidimensionais, sendo úteis para tabular dados. Arrays de duas dimensões, ou matrizes, são frequentemente utilizados em aplicações como processamento de imagens..

O que é pilha (stack) na estrutura de dados?

Em um array, é possível utilizar funções próprias para manipular elementos em qualquer posição da lista. No entanto, há situações em que é necessário mais controle sobre as operações realizadas na estrutura, como veremos adiante. Aí entra a implementação de estruturas de dados como a pilha (stack) e a fila (queue).

A pilha é uma estrutura de dados que, assim como o array, é similar a uma lista. O princípio básico da pilha é o LIFO (Last In, First Out), em que o último elemento inserido é o primeiro a ser removido.

Para entendermos melhor o que significa isso, pense em uma pilha de livros ou de pratos. Ao empilharmos livros, por exemplo, o primeiro livro a ser retirado da pilha é obrigatoriamente o último que foi colocado; se tentarmos retirar o último livro da pilha, tudo vai desabar. Ou seja, o último livro a ser empilhado é o primeiro a ser retirado.

No contexto da programação, pilhas geralmente permitem duas operações principais: 1) inserir um elemento no topo (push) e 2) remover o elemento do topo (pop).

Ao contrário do array, as linguagens de programação normalmente não têm métodos nativos para criação e manipulação de pilhas. Porém, é possível usar métodos de array para a implementação de pilhas.

Usos

O caso de uso mais famoso da pilha é a call stack ou pilha de chamadas de um programa que está sendo executado: a ordem de execução dos processos “chamados” por um programa via funções ou métodos obedece o princípio de pilha.

Outro recurso que utilizamos todos os dias e que utiliza pilhas para funcionar é o mecanismo de “voltar” e “avançar” páginas dos navegadores (representado normalmente por setas para a esquerda e direita).

Os endereços visitados vão se empilhando; ao chamarmos a função de “voltar”, o último endereço visitado - ou seja, o que está no topo da pilha - é o primeiro a ser visualizado.

O que é fila? Como funciona a estrutura de dados fila (queue)

A fila tem uma estrutura semelhante à pilha, porém com uma diferença conceitual importante: o paradigma por trás da fila é o FIFO - First In, First Out, ou “o primeiro a entrar é o primeiro a sair”, em tradução livre.

Pense em uma fila de bilheteria, por exemplo. A pessoa que chegou antes vai ser atendida (e comprar seu ingresso) antes de quem chegou depois e ficou atrás na fila. A fila como estrutura de dados segue o mesmo princípio.

Sendo assim, também há somente duas formas de se manipular uma fila: 1) Inserir um elemento no final da fila e 2) remover um elemento do início da fila.

O que é deque? Estrutura de dados deque (double-ended queue)

A estrutura de dados deque (abreviação de double-ended queue ou “fila de duas pontas”) é uma variação da fila que aceita inserção e remoção de elementos tanto do início quanto do final da fila.

Podemos comparar, novamente, com uma fila de pessoas em um guichê de atendimento: uma pessoa idosa que chega é atendida antes (ou seja, não pode ser colocada no fim da fila), ao mesmo tempo que uma pessoa que entrou no final da fila pode desistir de esperar e ir embora (nesse caso, não podemos esperar a pessoa chegar na frente da fila para retirá-la de lá).

Uma outra forma de se entender a estrutura deque é como uma junção das estruturas de pilha e fila.

O que é fila circular? Estrutura de dados circular queue

Outra variação da fila é a fila circular (circular queue), onde o último elemento é conectado com o primeiro elemento - como em um círculo:

Gráfico do tipo pizza dividido em 6 fatias com as mesmas proporções, cada fatia numerada com números de 0 a 5, em ordem. Por estarem ordenadas, a fatia de número 5 está ao lado da fatia de número 0.

A fila circular busca resolver uma limitação da fila linear, que é lidar com espaços vazios que podem se enfileirar após a retirada de elementos do início da fila.

Usos

Um uso fácil de lembrar para a fila é justamente a fila de impressão dos sistemas operacionais: o último trabalho de impressão a ser adicionado à fila será o último a ser impresso.

Além disso, as requisições feitas a um servidor também são organizadas em fila para serem respondidas, e quando alternamos entre programas utilizando o atalho alt+tab, o sistema operacional faz o gerenciamento da ordem utilizando o princípio de lista circular.

O que é lista ligada? Estrutura de dados ligada (linked list)

Já vimos que a maioria das linguagens de programação têm métodos nativos para a manipulação de arrays, como por exemplo inserir e remover elementos. Além disso, estes métodos fazem uma boa parte do trabalho de ordenar e buscar elementos por nós.

Porém, há três coisas importantes para sabermos sobre arrays: 1) na maior parte das linguagens de programação, os arrays têm tamanho fixo; 2) todos os elementos ocupam espaços sequenciais na memória e 3) inserir ou remover elementos do meio do array não é muito simples, pois exige que esses elementos sejam deslocados. Por exemplo:

// 0   1   2   3 
[46, 34, 76, 12] 
// removendo 76, o elemento 12 passa a ocupar o índice 2 
// 0  1   2 
[46, 34, 12] 
// 0   1   2   3 
[46, 34, 76, 12] 
// inserindo 25, o elemento 12 passa a ocupar o índice 4 
// 0  1   2   3   4 
[46, 34, 76, 25, 12]

Este trabalho de deslocamento de elementos é feito internamente pelos métodos nativos de array que as linguagens já têm e que utilizamos no dia-a-dia, por isso normalmente não nos preocupamos com isso. Mas ele está na implementação do método feita no código-fonte da linguagem.

Assim como arrays, as listas ligadas também armazenam elementos sequencialmente, porém, ao invés de armazenar os elementos de forma contígua na memória, como nos arrays, as listas ligadas não dependem desse tipo de organização.

Elas utilizam ponteiros para unir os elementos, e cada elemento “aponta” para o endereço de memória do próximo da lista, sem que ele precise estar no bloco de memória seguinte.

Dessa forma, ao trabalhar com listas ligadas também não é necessário fazer o deslocamento de elementos ao incluir ou excluir - considerando que, cada vez que esse deslocamento é feito em um array, é necessário reposicionar os elementos em novos espaços de memória.

Cada “nó” da lista aponta para o ponteiro de memória onde se encontra o próximo elemento, independente de onde esteja este espaço de memória.

Diagrama do fluxo de uma lista ligada. Os elementos estão divididos em nove retângulos, com diferentes valores de valor/dado e ponteiro do próximo nó. Cada nó está ligado ao dado no retângulo seguinte por uma seta, representando os processos interligados entre o ponteiro da memória e o próximo elemento.

Usos

Lembrando que a lista ligada encadeia elementos apontando para a localização do próximo item na memória, os programas de “álbum de fotos” (visualização de imagens) utilizam a lista ligada para encadear os arquivos de imagens e “chamar” a próxima imagem/voltar para a imagem anterior via setas do teclado ou botões de “anterior” e “próxima”. O mesmo princípio se aplica para playlists de música ou vídeo.

O que é conjunto (set)? Estrutura de dados set e seus usos

A estrutura de dados conjunto (ou set) é uma lista não ordenada de elementos únicos. Ou seja, não é possível repetir o valor de um elemento dentro de um conjunto.

Por exemplo, é perfeitamente possível criar um array com os seguintes elementos:

const lista = [1, 1, 1, 3, 5, 7, 9];

No entanto, em um conjunto, valores repetidos não são permitidos, independentemente da ordem dos elementos.

A maior parte das linguagens de programação mais usadas têm métodos nativos para criação de conjuntos. No caso do JavaScript:

const lista = [1, 1, 1, 3, 5, 7, 9]; 
const conjunto = new Set(lista); 
console.log(conjunto); 
// Set(5) { 1, 3, 5, 7, 9 }

Usos

Como você pode ter imaginado, a estrutura do conjunto vem da matemática, e também é possível fazer operações como união e intersecção em conjuntos de dados. Um dos usos mais comuns desta estrutura é em bancos de dados SQL.

O que é dicionário (hashmap)? Estrutura de dados chave-valor

Dicionário (também chamado de mapa, map ou hashmap) é uma estrutura que armazena dados em pares de chave-valor, utilizando as chaves para localizar rapidamente os valores associados. Isso difere das estruturas vistas anteriormente, que lidam principalmente com listas sequenciais de valores.

Essa descrição parece muito uma outra estrutura que já conhecemos, o objeto. Mas há várias diferenças entre dicionários/mapas e objetos.

Por exemplo, é possível mapear o tamanho de um dicionário (ou seja, a quantidade de pares chave/valor) e os dicionários podem aceitar qualquer tipo de dado como chave (objetos aceitam apenas strings ou symbols).

Os dicionários também podem ter performance melhor em buscas e manipulação de dados do que objetos, pois utilizam referências para as chaves - de uma forma similar a ponteiros, as chaves apontam para o endereço de memória de seus valores.

Um aspecto importante sobre dicionários vs objetos: a decisão sobre qual utilizar vai depender muito da linguagem. Cada linguagem implementa seus próprios métodos para criação de instâncias de objetos ou dicionários e para a manipulação dos dados.

Por exemplo, dicionários em Python não eram ordenados por padrão até a versão 3.6, já o objeto Map() em JavaScript é ordenado por padrão; outras linguagens podem ter suporte a dicionários, porém não a objetos.

Usos

O formato chave:valor do dicionário é o mais comum para lidar com dados armazenados em bancos de dados, mas não apenas para isso: o formato é usado sempre que há a necessidade de associar dados e referências para consulta posterior, sejam informações da base de dados de um produto ou mesmo a relação entre o nome de um arquivo e o seu caminho interno na memória do computador, feita pelo sistema operacional.

Além disso, dicionários/mapas são fundamentais para implementações de cache, memoização, indexação e estruturas de dados auxiliares em algoritmos de busca e otimização.

O que é árvore? Estrutura de dados árvore binária e suas aplicações

A árvore é uma estrutura não-sequencial, muito útil para armazenar dados de forma hierárquica e que podem ser acessados de forma rápida.

Pode-se definir árvore como uma coleção de dados representados por nós e arranjados em níveis hierárquicos (ao invés de sequências como as estruturas vistas anteriormente).

Um exemplo de estrutura em árvore são os organogramas de empresas:

Organograma empresarial em formato de árvore hierárquica: no topo um líder, ramificando em três vice-líderes (A, B e C), cada qual com três gerentes subordinados (A1-A3, B1-B2, C1-C2), totalizando3 níveis hierárquicos.

A estrutura mais comum é a árvore binária, em que cada nó pode ter no máximo dois filhos a partir do nó inicial (chamado de raiz ou root). Um nó pode ter pais, irmãos e filhos; nós com pelo menos um filho são chamados de nós internos, enquanto aqueles sem filhos são chamados de nós externos ou folhas:

A partir da estrutura de árvore binária (com um nó-filho à esquerda e um à direita da raiz) é possível estruturar a chamada BST, ou árvore de busca binária (binary search tree), que utiliza o princípio do algoritmo de busca binária para estruturar os dados de forma que valores menores estejam à esquerda da raiz e valores maiores à direita.

Essa união do algoritmo com a estrutura de dados leva a uma maior eficiência na manipulação de dados, seja para buscar, alterar, incluir ou remover elementos.

Heap binário

O heap binário é um tipo especial de árvore binária, normalmente utilizada em computação para implementar filas de prioridade, pois em um heap pode-se extrair de forma mais eficiente o valor mínimo ou máximo de uma lista. Pode-se traduzir heap, muito livremente, como um “monte” ou “porção” de dados.

O heap binário se difere da árvore binária em duas características principais:

Todos os níveis, com exceção do último, têm filhos tanto na esquerda quanto na direita da raiz. No último nível, os filhos se posicionam o mais à esquerda possível. É o que chamamos de árvore completa.
Pode ser um heap mínimo (min heap), em que o menor valor está na raiz, ou um heap máximo (max heap), no qual o maior valor está na raiz. Em ambos os casos, todos os nós seguem uma relação de ordem com seus filhos, sendo `>= no heap máximo e <=` no heap mínimo.

Usos

A estrutura de árvore tem vários usos diversos, como algoritmos de tomada de decisão em aprendizado de máquina, indexação de bancos de dados, indexação e exibição de arquivos e pastas no explorador de arquivos dos sistemas operacionais, entre vários outros casos.

O heap binário, como já mencionamos, é usado em filas de prioridade (tipo especial de fila onde os elementos são retirados da fila não no padrão FIFO, mas sim organizados por prioridade: mais prioritários no início da fila e menos prioritários no final) e também em um algoritmo de ordenação específico, o heap sort.

O que é grafo? Grafos na estrutura de dados e aplicações

Outra estrutura não-sequencial, o grafo (graph) é um conjunto de nós (ou vértices), ordenados ou não e ligados por arestas, formando uma estrutura em forma de rede.

O grafo acima pode ser representado da seguinte forma: V = {1, 2, 3, 4, 5, 6} (os vértices ou nós) e E = {(1,2), (2,3), (3,4), (3,6), (4,2), (4,5), (5,1), (5,2), (5,6)} (as arestas ou edges).

Cada um dos vértices do grafo podem representar um tipo de dado ou sua referência. As arestas podem ser não-direcionadas - como no caso acima, onde as arestas não têm uma direção definida - ou direcionadas, como no caso abaixo:

As arestas de um grafo também podem ter um valor (também chamado de peso), que representam custo computacional, capacidade, etc para cada “caminho”.

Usos

As redes sociais utilizam os grafos para manejar a grande quantidade de dados relacionados entre si que recebem a cada instante. O exemplo mais famoso, a linguagem de consulta GraphQL, foi criada pelo Facebook (atual Meta) em 2012 e lançada como open source em 2015 com o intuito de otimizar a busca de dados em aplicações mobile e web, especialmente o News Feed do Facebook iOS..

Outro uso famoso para os grafos é o sistema de navegação dos aplicativos de mapas/GPS, que utilizam grafos e o algoritmo de caminho mínimo (ou shortest path) para traçar rotas.

Por que estudar estrutura de dados e algoritmos? Próximos passos para quem quer aprofundar

Como você pode perceber, o estudo aprofundado de cada estrutura apresentada pode levar horas, exigindo dedicação tanto para entender os paradigmas quanto para implementar exemplos práticos.

Muitas linguagens já oferecem bibliotecas e métodos prontos para essas estruturas, mas é enriquecedor compreender como funcionam 'por baixo dos panos'.

O estudo de estruturas de dados, junto com o de algoritmos, é parte essencial dos fundamentos da programação. É interessante combinar o estudo destes temas com a prática “mão na massa” em projetos, para aos poucos agregarmos cada vez mais conhecimento prático e teórico.

Se você quer se aprofundar mais no tema, confira nossa Formação Estrutura de Dados e Algoritmos, com projetos práticos e acompanhamento passo a passo. Também sugerimos a leitura de outros artigos sobre: Linked list: entenda em detalhes, Estruturas de dados lineares e não lineares e Grafo: como funciona na programação.

Bons estudos!

Imersões

7 Days of Code

Artigos

Podcasts

Tech Guide

Vídeos Extras

Depoimentos de Alunos

Cases de Sucesso Exclusivo para estudantes Alura

O que são estruturas de dados? Uma introdução a estruturas de dados e algoritmos na programação

O que são dados na programação?

O que é estrutura de dados em programação? Conceito e exemplos

Características das estruturas de dados

O que é array? Estrutura de dados array na prática

Usos

O que é pilha (stack) na estrutura de dados?

Usos

O que é fila? Como funciona a estrutura de dados fila (queue)

O que é deque? Estrutura de dados deque (double-ended queue)

O que é fila circular? Estrutura de dados circular queue

Usos

O que é lista ligada? Estrutura de dados ligada (linked list)

Usos

O que é conjunto (set)? Estrutura de dados set e seus usos

Usos

O que é dicionário (hashmap)? Estrutura de dados chave-valor

Usos

O que é árvore? Estrutura de dados árvore binária e suas aplicações

Heap binário

Usos

O que é grafo? Grafos na estrutura de dados e aplicações

Usos

Por que estudar estrutura de dados e algoritmos? Próximos passos para quem quer aprofundar

Leia também

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP