Usando a análise de clúster en Microsoft Excel

Pin
Send
Share
Send

Unha das ferramentas para resolver problemas económicos é a análise de clústers. Coa súa axuda, os clústers e outros obxectos da matriz de datos clasifícanse en grupos. Esta técnica pódese aplicar en Excel. Vexamos como se fai isto na práctica.

Usando Análise de Clúster

Coa axuda da análise de clúster, é posible realizar a mostraxe polo atributo que se está estudando. A súa tarefa principal é dividir unha matriz multidimensional en grupos homoxéneos. Como criterio de agrupación, úsase un coeficiente de correlación de par ou unha distancia euclidiana entre obxectos por un parámetro dado. Os valores máis próximos uns dos outros agrúpanse.

Aínda que este tipo de análise úsase máis frecuentemente en economía, tamén se pode usar en bioloxía (para clasificar animais), psicoloxía, medicina e en moitas outras áreas da actividade humana. A análise de cluster pódese aplicar mediante o kit de ferramentas estándar de Excel para estes efectos.

Exemplo de uso

Temos cinco obxectos que se caracterizan por dous parámetros estudados - x e y.

  1. Aplicamos a fórmula de distancia euclidiana a estes valores, que se calcula segundo o modelo:

    = ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2)

  2. Este valor calcúlase entre cada un dos cinco obxectos. Os resultados do cálculo sitúanse na matriz de distancia.
  3. Miremos entre que valores a distancia é a menos. No noso exemplo, estes son obxectos 1 e 2. A distancia entre eles é de 4.123106, que é menor que entre calquera outro elemento desta poboación.
  4. Combina estes datos nun grupo e forme unha nova matriz na que os valores 1,2 actúa como un elemento separado. Ao compilar a matriz, deixamos os valores máis pequenos da táboa anterior para o elemento combinado. De novo miramos, entre que elementos a distancia é mínima. Esta vez é 4 e 5así como o obxecto 5 e grupo de obxectos 1,2. A distancia é 6.708204.
  5. Engadimos os elementos especificados ao cluster xeral. Formamos unha nova matriz segundo o mesmo principio que a época anterior. É dicir, estamos a buscar os valores máis pequenos. Así, vemos que o noso conxunto de datos pódese dividir en dous grupos. O primeiro clúster contén os elementos máis próximos entre si - 1,2,4,5. No segundo clúster no noso caso, só se presenta un elemento: 3. Está relativamente lonxe doutros obxectos. A distancia entre os clústers é de 9,84.

Completa o procedemento para dividir a poboación en grupos.

Como podes ver, aínda que en xeral a análise de clústers pode parecer un procedemento complicado, de feito, non é tan difícil comprender os matices deste método. O principal é comprender o patrón básico de agrupación.

Pin
Send
Share
Send