1
resposta

[Dúvida] utilizar matriz de correlação com clusters

nos cursos de classificação se utilizava de vez em quando a matriz de correlação pra entender quais atributos se correlacionam mais pra tomada de decisão dos modelos na clusterização, vale a pena utilizar essa matriz pra selecionar os atributos com maior variância pra definir os padrões de cada cluster?

1 resposta

Olá, Danilo, tudo bem?

Na clusterização, a matriz de correlação também pode ser empregada, mas de uma maneira um pouco diferente. A matriz de correlação pode ajudar na tarefa de identificar atributos que são altamente correlacionados. E você pode optar por reduzir a dimensionalidade dos dados, selecionando apenas atributos correlacionados relevantes, evitando redundâncias e simplificando a análise.

Além disso, escolher características que mudam bastante pode ser uma boa ideia, pois podem ajudar a diferenciar bem os grupos. Por exemplo, se você está analisando dados de clientes e percebe que a frequência de compras varia muito, essa característica pode ser intressante para identificar diferentes padrões de compra, mostrando que os clientes têm comportamentos de compra bem diferentes uns dos outros.

Apenas destaco que deve ter cautela ao selecionar os atributos, pois remover características só com base na correlação ou variância pode resultar na perda de informações

Espero ter ajudado.

Qualquer dúvida, compartilhe no fórum.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software