[pyar] Palabras parecidas

Matias Graña matias.alejo en gmail.com
Jue Jun 10 22:47:10 ART 2010


2010/6/10 Jose Jachuf <jjachuf en gmail.com>:
> Hola
>
>
> Tengo una lista con nombres de calles únicas. Dado un nombre de calle
> que no se encuentre en esta lista, debo "sugerir" opciones de nombres
> de calles parecidos. Actualmente estoy usando dos maneras simultaneas:
>
> 1) Si la cadena calle está contenida en alguna de las calles de la
> lista o viceversa agrego la calle como sugerencia con distancia igual
> a cero.
> 2) Uso el algoritmo levenshtein [1].
>
> Luego ordeno las calles por distancia y devuelvo una porción de la
> lista de sugerencias.
>
>
> Además de esto, que otra opción / algoritmo conocen para resolver este problema.
>
> Saludos
> Jose
>
> [1] http://es.wikipedia.org/wiki/Distancia_de_Levenshtein

Esto depende mucho de cómo recibís el nombre que querés buscar. Es una
persona que tipea? Puede tener errores de ortografía? En ese caso, un
algoritmo de Levenshtein que le dè menos peso a cambios entre letras
que suenan igual (como c/s ó c/k, dependiendo de lo que siga) debería
funcionar mejor que Levenshtein pelado.
Algo que posiblemente te sirva es quitar ciertas palabras opcionales
en un nombre, como "Avenida"/"Avda"/"Av", etc. O dar vuelta las
palabras si hay más de una.

Matías



More information about the pyar mailing list