Clúster

Clúster o clustering son métodos estadísticos utilizados para agrupar casos que serán utilizados para medir diferentes variables o características.

Es el proceso de dividir un conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de un grupo esté lo más cercano posible al otro, al mismo tiempo que los grupos diferentes estén lo más alejados posible entre ellos.

No se puede definir con precisión que es un clúster. Por ello existen dos métodos de clustering los cuales son jerárquicos y no jerárquicos.

            Jerárquicos: Estar en un nivel condiciona la pertenencia a otro nivel jerárquico.

            No jerárquicos: Única partición de los datos mediante la optimización de alguna función adecuada.

El método de clúster es utilizado en casos cuando:

            Recopilar y clasificar a mano es costoso
            Los patrones cambian con el tiempo
            Es necesario encontrar características para crear clasificadores
 
Las aplicaciones que tiene en la vida real son en robótica para el aprendizaje y minería de datos buscando patrones que puedan ser expresados como un modelo.

En el siguiente video se puede ver cómo funciona el clúster

http://www.youtube.com/watch?v=yl_KZ86NT-A

Bibliografía:

Hartigan, John A. Clustering algorithms. John Wiley & Sons, Inc., 1975.

Jain, Anil K., and Richard C. Dubes. Algorithms for clustering data. Prentice-Hall, Inc., 1988.