1
resposta

Limite (threshold) = 3. Por que?

Olá, boa tarde.

Eu não entendi o porquê de usar o limite (threshold) = 3 no estudo para descobrirmos outliers, na aula 05 do pré-=processamento dos dados. A única informação que achei diz que esse é o threshold comum de se usar, mas qual seria o motivo? Por que não usar um número maior ou menor?

1 resposta

Oi, Rennan, tudo bem?

O limite (threshold) de 3 é comumente utilizado para identificar outliers porque é considerado um valor conservador. Ou seja, ele é mais restritivo na identificação de valores discrepantes.

Utilizar um valor maior poderia resultar em uma remoção excessiva de dados, enquanto um valor menor poderia não identificar todos os outliers relevantes. O valor de 3 é uma escolha padrão, mas é importante ajustá-lo conforme o contexto e os dados específicos do problema.

Espero ter ajudado. Caso tenha dúvidas, conte com o fórum. Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software