Esta é uma aplicação estatística envolvendo clusterização utilizando
dados de veículos da
Tabela Fipe
do mês de junho de 2024 usando a linguagem R.
Trata-se sobre uma ferramenta criada para o usuário selecionar um veículo
e obter como resposta, os 10 veículos mais similares da respectiva escolha.
Para isso, foi utilizado uma técnica de mineração de dados chamada
k-means
e a métrica de distância entre os pontos chamada de
Distância Euclidiana
.
Para a clusterização, utilizamos as variáveis:
Ano
Câmbio
Cilindros
Cilindradas
Combustível
Tração
Válvulas
Preço
Dentro do nosso conjunto de dados, não estão incluso motos,
caminhões e veículos elétricos. Além de que selecionamos
apenas veículos fabricados a partir do ano 2000.