[pyar] Problemas con hcluster

Hernan Grecco hernan.grecco en gmail.com
Lun Mayo 7 09:45:21 ART 2012


Hola Alejandro,

Tenes dos formas de hacer esto, ambas a traves del "linkage matrix".

1.- Podes crear un arbol con la funcion `to_tree` y despues caminarlo
mirando sus propiedades `left, right, dist, id`.

2.- Podes crear clusteres planos usando la function fcluster.

Te recomiendo empezar por la 2. En ambos casos tenes que elegir una
linea de corte para determinar cuantos grupos queres considerar.

Suerte,

Hernan

2012/5/7 Alejandro Alvarez <alvarez.ciencia en gmail.com>:
> Corrijo ...
>
> Dist=Matriz_de_Distancias() # que es básicamente 1-Matriz de Similaridad ...
> (un error de jerga) :-)
>
> El 7 de mayo de 2012 05:27, Alejandro Alvarez <alvarez.ciencia en gmail.com>
> escribió:
>
>> Saludos,
>>
>> He implementado un código para generar clusters en una serie de datos.
>> Básicamente
>> lo que hice fue generar una matriz de similaridad y de ahí en adelante es
>> pan comido.
>>
>> el código para esa parte es básicamente el siguiente:
>>
>> DIST=Matriz_de_Similaridad()
>>
>> sqfrm = squareform(DIST)
>>
>> clustering = linkage(sqfrm, method='complete')
>>
>> R=dendrogram(clustering, labels=NODES, get_leaves=True)
>>
>> matplotlib.pylab.show()
>>
>>
>> logro plotear el dendrograma, pero por mas que leo la documentación,
>> no veo como obtener los clusters en formato dato, es decir, listas
>> de etiquetas, con algún número que indique el nivel de similaridad
>> en el que se unieron, o bien, todos los clusters formados en un nivel
>> de similaridad dado.
>>
>> Si alguien tiene experiencia con python-hcluster o scipy.hcluster
>> (pues entiendo que son básicamente el mismo proyecto), lo agradecería
>> enormemente.
>>
>> Saludos Cordiales,
>>
>> --
>> Alejandro J. Alvarez S.
>> Master Student,
>> Department of Mathematics
>> Instituto Venezolano de Investigaciones Científicas. I.V.I.C.
>>
>> Stochastic Dynamics Lab.
>> Center for Physic.
>> Instituto Venezolano de Investigaciones Científicas. I.V.I.C.
>>
>> Telf. +58-212-5041919.
>>
>
>
>
> --
> Alejandro J. Alvarez S.
> Master Student,
> Department of Mathematics
> Instituto Venezolano de Investigaciones Científicas. I.V.I.C.
>
> Stochastic Dynamics Lab.
> Center for Physic.
> Instituto Venezolano de Investigaciones Científicas. I.V.I.C.
>
> Telf. +58-212-5041919.
>
>
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar



More information about the pyar mailing list