[pyar] Palabras parecidas

Sebastian Bassi sbassi en clubdelarazon.org
Jue Jun 10 22:44:57 ART 2010


2010/6/10 Jose Jachuf <jjachuf en gmail.com>

> Además de esto, que otra opción / algoritmo conocen para resolver este
> problema.
>

Mirá este hilo donde pregunté algo asi:
http://proposicion.org.ar/lurker/message/20090423.135854.847b85c8.es.html

En ese caso terminé usando esto:

*>>> import difflib
>>> a1='13904-Slmi17003G01PCRright-sp6-t7(257-112)_2008-10-31_C04.phd.1'
>>> a2='13904-Slmi17003G01-Slmi17003G01right_2008-10-31_C04.ab1'
>>> difflib.SequenceMatcher(None, a1, a2).quick_ratio()*
0.74576271186440679

(que me funcionaba mejor que
Levenshtein<http://es.wikipedia.org/wiki/Distancia_de_Levenshtein> al
menos para mis datos)

<http://proposicion.org.ar/lurker/message/20090423.135854.847b85c8.es.html>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20100610/94832883/attachment.html>


More information about the pyar mailing list