Clúster

Clúster o clustering son métodos estadísticos utilizados para agrupar casos que serán utilizados para medir diferentes variables o características.

Es el proceso de dividir un conjunto de datos en grupos mutuamente excluyentes de tal manera que cada miembro de un grupo esté lo más cercano posible al otro, al mismo tiempo que los grupos diferentes estén lo más alejados posible entre ellos.

No se puede definir con precisión que es un clúster. Por ello existen dos métodos de clustering los cuales son jerárquicos y no jerárquicos.

            Jerárquicos: Estar en un nivel condiciona la pertenencia a otro nivel jerárquico.

            No jerárquicos: Única partición de los datos mediante la optimización de alguna función adecuada.

El método de clúster es utilizado en casos cuando:

            Recopilar y clasificar a mano es costoso
            Los patrones cambian con el tiempo
            Es necesario encontrar características para crear clasificadores
 
Las aplicaciones que tiene en la vida real son en robótica para el aprendizaje y minería de datos buscando patrones que puedan ser expresados como un modelo.

En el siguiente video se puede ver cómo funciona el clúster

http://www.youtube.com/watch?v=yl_KZ86NT-A

Bibliografía:

Hartigan, John A. Clustering algorithms. John Wiley & Sons, Inc., 1975.

Jain, Anil K., and Richard C. Dubes. Algorithms for clustering data. Prentice-Hall, Inc., 1988.

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s