4.4 Evaluación en Clustering

El Clustering es una forma de tratar los datos para los que no se conocen o no están definidos los grupos. Por tanto, tenemos que conceptualizar los grupos. Este hecho dificultad evaluar la calidad de los clasificación obtenida.

4.4.1 Silueta

El coeficiente silueta proporciona una representación gráfica del grado de integración de un objeto en su cluster. El coeficiente silueta de un objeto \(i\) se define como:

\[s_i=\dfrac{b_i -a_i}{max(b_i -a_i)}\]

donde \(a_i\) denota la distancia media entre el objeto \(i\) y todos los otros objetos de su cluster y \(b_i\) denota la distancia media mínima entre \(i\) y los objetos de otros clusters. Los objetos con un coeficiente de silueta \(s_i\) alto están bien integrados en su cluster; aquéllos con un si bajo tienden a estar entre clusters.