Alura > Cursos de Inovação & Gestão > Cursos de Marketing Analytics > Conteúdos de Marketing Analytics > Primeiras aulas do curso Bigquery: atribuindo dados à jornada do cliente

Bigquery: atribuindo dados à jornada do cliente

Modelos de atribuição com SQL e BigQuery - Apresentação

Apresentando o instrutor e os objetivos do curso

Olá! Eu sou Leonardo Thomas. Atuo há oito anos no mercado de dados aplicados ao marketing. Atualmente, sou líder de uma equipe de Martech.

Neste curso, vamos aprender sobre modelos de atribuição com SQL aplicados no BigQuery. Ao longo do percurso:

Implementando modelos de atribuição no BigQuery

Em seguida, implementaremos, com SQL no BigQuery, diferentes modelos de atribuição: o modelo de First Click (primeiro clique), o de Last Click (último clique), além de um modelo linear e um modelo de Time Decay (decaimento temporal).

Ao final, nós tomaremos esses dados e os colocaremos em um caso de negócio. Vamos aplicá-los para entendermos como usamos os dados deste modelo a nosso favor e como, de fato, tiramos proveito desse entendimento.

Construindo o dashboard e apresentando próximos passos

Agora, se observarmos nossa tela, ao final do curso construiremos um dashboard (painel) simples, mas que reunirá todas as informações desenvolvidas ao longo do curso, provenientes de diferentes modelos para diferentes canais, e como cada canal apresentou um resultado financeiro nesses modelos. Poderemos ver, por exemplo, que canais como Google CPC terão resultados diferentes, dependendo de qual modelo estivermos utilizando.

Eu espero vocês nas próximas aulas. Nós temos muitos assuntos interessantes para aprender. Em caso de dúvidas, o contato pode ser feito pelas redes sociais, principalmente no LinkedIn. Será bom ter vocês ao longo deste percurso, no qual vamos aprender como construir um modelo de atribuição com SQL dentro do BigQuery. Eu espero vocês nas próximas aulas. Até mais!

Modelos de atribuição com SQL e BigQuery - O modelo last-click e seus limites

Apresentando o tema e o contexto

Modelo de last click: funcionamento, limitações e aplicação

Nesta aula, vamos discutir o modelo de last click (último clique), como funciona, algumas de suas limitações e onde se aplica.

Antes, apresentamos o contexto de uso: a Zoop Megastore é uma empresa varejista com diversos produtos vendidos em seu site. A empresa investe em mídia paga, em canais como Google Ads e Facebook, e enfrenta o desafio de entender como as compras realizadas pelas pessoas usuárias no site são atribuídas corretamente a cada um desses canais.

Diante disso, surge a temática de modelagem de dados de atribuição, na qual introduzimos o conceito de last click (último clique), que basicamente define a quem vamos atribuir a venda da pessoa usuária.

Atualmente, um problema comum na Zoop Megastore é que, ao analisar diferentes ferramentas, obtemos visões distintas de atribuição, de acordo com as metodologias utilizadas por cada uma. Por exemplo, na ferramenta Meta Ads, observamos mais de 800 vendas; no TikTok, 612; e no GA4, que utiliza a atribuição de last click (último clique), vemos 390 vendas. Aqui, não há necessariamente uma ferramenta certa ou errada, e sim metodologias diferentes e formas distintas de atribuição em cada uma. É importante entendermos de onde parte o GA4, que vamos utilizar ao longo deste curso: sua atribuição — uma das predefinidas da ferramenta e também muito utilizada no mercado — é o last click (último clique).

Exemplificando a jornada e a atribuição

O que é esse modelo? Vejamos um exemplo de jornada hipotética de uma pessoa usuária. Primeiro, ela viu uma publicação da nossa loja no Instagram, de forma orgânica. Em seguida, pesquisou de forma orgânica mais sobre nosso produto e acessou nosso site. Depois, recebeu um e-mail promocional sobre uma promoção que a Zoop terá no mês de abril. Após receber essa promoção, a pessoa abriu o navegador, pesquisou no Google o nome da nossa loja, Zoop Megastore, clicou em um anúncio de uma campanha de mídia paga por meio de Paid Search (pesquisa paga), acessou nosso site e realizou a compra. Esta é uma jornada hipotética; existem inúmeras outras que podem ocorrer com diferentes pessoas usuárias.

Nesse recorte, o que acontece no modelo de last click (último clique)? 100% do crédito é atribuído ao Google em Paid Search (pesquisa paga), a rede de busca no final da jornada, porque foi esse o canal que recebeu o último clique.

Analisando consequências e vieses

Qual é a consequência disso? Nós tendemos a supervalorizar a etapa final do funil, afirmando que somente aquela campanha contribuiu para a compra como um todo, e subestimamos os canais do topo do funil, que têm outros objetivos em conjunto, como o nosso Instagram mencionado anteriormente, por exemplo.

Quando tomamos decisões de orçamento de uma loja — como contratar outra pessoa, investir mais em mídia paga ou definir onde vamos focar nossa estratégia no próximo mês — pode acontecer, ao olharmos apenas para o modelo de last click (último clique), de enxergarmos um viés voltado somente para quem finalizou a jornada, e não para quem iniciou e participou ao longo do caminho.

Detalhando limitações em awareness e jornadas longas

Dito isso, mencionamos aqui um exemplo de jornada completa que começa no Instagram. Mas onde geralmente o last click (último clique) não costuma observar? Canais como o Instagram, focados em awareness (consciência de marca) — isto é, em falar sobre o branding (gestão de marca) ou sobre diferentes linhas editoriais que vamos adotar — fazem parte de estratégias voltadas mais para awareness (consciência de marca) em conjunto e podem ser desconsiderados. A busca orgânica, o nosso blog e a forma como produzimos nossos artigos — que as pessoas leem e pelas quais passam a conhecer nossa marca — também podem ser ignorados em uma jornada completa.

A busca orgânica, o nosso blog e a forma como produzimos nossos artigos — que as pessoas leem e pelas quais passam a conhecer nossa marca — também podem ser ignorados em uma jornada completa.

A parte de marketing de meio de funil, que nutre a pessoa usuária, fornece informações e aprofunda o conhecimento sobre o produto e seus benefícios, integra essa jornada e igualmente pode ser desconsiderada. O mesmo vale para jornadas muito longas, em que alguém demora mais tempo, acumula muitos touch points (pontos de contato) com a nossa marca até decidir, ou para produtos que, por natureza, exigem um período extenso de consideração — podendo levar meses ou, eventualmente, anos até a decisão.

Introduzindo alternativas e próximos passos

Diante disso, temos outras abordagens de modelos de atribuição, não apenas o last click (último clique), que vamos abordar ao longo deste curso. Trata-se tanto de jornadas com multi touch points (múltiplos pontos de contato) quanto de outras aproximações que veremos adiante, nas quais definimos como e com qual estratégia vamos atribuir peso a cada um desses pontos de contato que a pessoa usuária tem. De acordo com um estudo do Google, de 6 a 8 touch points (pontos de contato) são interações médias que as pessoas têm com uma marca antes de tomar uma decisão. Toda essa jornada de busca e decisão leva tempo, em média, e também envolve pessoas usuárias que passaram por diferentes dispositivos e que, de modo geral, têm um ciclo de decisão mais longo.

Nós vamos avançar, saindo da nossa jornada de atribuição por last click (último clique), e comparar essa jornada com outros modelos de atribuição, como multi touch points (múltiplos pontos de contato) e os demais modelos que veremos aqui.

Certo? Eu espero vocês lá!

Modelos de atribuição com SQL e BigQuery - Como o GA4 registra a jornada do cliente

Apresentando o GA4 e o escopo do curso

Nesta aula, vamos falar sobre GA4, que será a ferramenta que utilizaremos como nossa fonte de dados para todo este curso, e sobre como esses dados funcionam internamente.

Na nossa loja, a Fluid Megastore, já temos o GA4 instalado em nosso site. Ele está coletando informações de eventos e parâmetros, e podemos usar esses dados a nosso favor.

Aqui, não vamos nos aprofundar em como usar o GA4 ou fazer uma introdução completa à ferramenta, mas construiremos uma base rápida para compreender como tudo será estruturado mais adiante. Precisaremos, sobretudo, entender como esses dados são exportados.

Explicando os escopos de dados no GA4

Dito isso, um ponto importante no GA4 é a forma como a informação é organizada e como cada dado é processado. Hoje, no GA4, trabalhamos com quatro escopos principais, quatro camadas:

O que é cada um deles? Usuário é cada pessoa que interage com nossa loja, acessa nosso site, realiza uma compra etc. Como um usuário é uma pessoa única ali, ele é nosso proxy mais próximo.

Sessão representa os diferentes pontos de contato que essa pessoa terá com nosso site em geral. Uma mesma pessoa pode ter mais de uma sessão no site da nossa loja.

Dentro de uma sessão, podemos ter vários eventos, como visualizar uma página ou realizar uma compra. Além disso, dentro desse evento, podemos ter uma série de parâmetros que dão o contexto do que esse evento significa.

Interpretando eventos, métricas e hierarquias

Por exemplo, no GA4, estamos em uma página visualizando os últimos 28 dias da conta de demonstração que temos aqui, à qual também podemos acessar, na seção de engajamento de eventos. O que estamos vendo? Quais eventos ocorreram em nosso site nos últimos 28 dias e quantas vezes cada um foi contabilizado.

É importante entendermos o contexto de cada um desses itens. Por exemplo, tivemos 260 mil eventos de visualização de página em nosso site. Se voltarmos ao conteúdo da aula: em qual escopo essa informação foi coletada? Da mesma forma, se acessarmos um relatório que trata de aquisição de tráfego em nível de sessão, ao apresentar uma métrica de sessão, precisamos entender o que cada um desses conceitos representa, assim como quando falamos de usuário. Esses são parâmetros importantes, com os quais vamos nos familiarizando aos poucos, porque são escopos diferentes e métricas distintas que o GA4 apresenta para nós, e é importante dominá-los.

Concentrando a informação: uma pessoa usuária pode ter várias sessões, uma sessão pode ter vários eventos e um evento pode ter vários parâmetros para dar contexto.

Revisando rapidamente o que já comentamos sobre os eventos que podem ocorrer no GA4 em nossa loja: temos o evento page_view, que ocorre em cada página, o evento login (início de sessão), a conversão de uma pessoa em lead (potencial cliente) e a realização de uma compra. Entre os parâmetros possíveis, estão o valor da compra realizada e o ID da transação, entre outros. Esses são exemplos de eventos e parâmetros que ocorrem dentro do GA4.

Entendendo parâmetros UTM e análise de aquisição

Além disso, temos outro contexto que, para profissionais de marketing (marketing), é muito importante dominar: os parâmetros UTM. Garantindo que estejamos na mesma página, o que são esses parâmetros? São marcadores adicionados às URLs pelas quais as pessoas chegam ao nosso site, que fornecem contexto sobre de onde vieram ou qual foi a ação anterior realizada antes de entrarem no nosso site.

Para que isso serve? Para que possamos ler o desempenho dos diferentes canais e entender como cada canal está performando de modo geral. Quando colocamos um link em mídia paga, em mídias sociais orgânicas ou em e-mail, podemos configurar as informações de UTM para obter esse contexto. Além disso, a própria plataforma Google Analytics (Google Analytics) pode, em alguns casos, realizar classificações automáticas. Por exemplo, identificar que aquela pessoa veio da busca orgânica do Google; com base na referência, isto é, no parâmetro de referral (referência), entender de onde a pessoa veio; ou classificar como acesso direto. Em termos gerais, são os parâmetros que nos dão o contexto de onde as pessoas chegaram ao nosso site.

Dentro do GA4 (Google Analytics 4), ao analisarmos esses parâmetros, o Google apresenta, por exemplo, no relatório de aquisição de sessões, algumas regras de agrupamento automático que podemos personalizar ou não — não vamos abordar esses pontos aqui. Vamos observar os próprios parâmetros coletados, como source/medium, no escopo de sessão.

Ordenando por sessões, nos últimos 28 dias, podemos ver pessoas que vieram de Google orgânico, de CPC (custo por clique), de Bing, de uma newsletter (boletim informativo) por e-mail, bem como de sites de referência em geral. Assim, conseguimos entender quais canais mais contribuem de forma geral, da mesma forma que faríamos para qualquer outro evento.

Se quisermos ver o evento purchase, por exemplo, para identificar quais canais trouxeram mais vendas, também podemos ordenar dessa maneira e ter a mesma leitura. Podemos observar, por exemplo, um canal como analytics.webspot de referral (referência) que, apesar de trazer menos sessões do que outro canal subjacente, trouxe mais vendas. Portanto, UTMs ajudam a fornecer contexto sobre de onde a pessoa veio e o que fez em nosso site.

Selecionando parâmetros-chave para atribuição

Alguns parâmetros importantes que usaremos ao longo do curso são:

Com essas informações, poderemos utilizar os dados para realizar atribuições entre diferentes canais de maneira geral. Esses serão os parâmetros-chave que usaremos ao longo do curso.

Sobre o curso Bigquery: atribuindo dados à jornada do cliente

O curso Bigquery: atribuindo dados à jornada do cliente possui 122 minutos de vídeos, em um total de 41 atividades. Gostou? Conheça nossos outros cursos de Marketing Analytics em Inovação & Gestão, ou leia nossos artigos de Inovação & Gestão.

Matricule-se e comece a estudar com a gente hoje! Conheça outros tópicos abordados durante o curso:

Aprenda Marketing Analytics acessando integralmente esse e outros cursos, comece hoje!

Conheça os Planos para Empresas