[pyar] Buscando la subcadena comun mas larga

Lucas rollbak en gmail.com
Mar Jul 13 00:32:55 ART 2010


2010/7/13 Lucas <rollbak en gmail.com>

> 2010/7/12 Anthony Lenton <antoniolenton en gmail.com>
>
>> 2010/7/12 Daniel Moisset <dmoisset en machinalis.com>:
>> > 2010/7/12 Anthony Lenton <antoniolenton en gmail.com>:
>> >> Buenas!
>> >>
>> >> Ando queriendo que hacer búsquedas de la subcadena común más larga
>> >> entre dos strings.  Bueno, en realidad entre todos los pares de una
>> >> bolsa de como 1000 strings, por lo que me anda leeento.
>> >
>> > con "todos los pares" te referis a los ~500K pares? cual es el
>> > resultado que necesitas obtener? segun eso probablemente le puedas
>> > sacar mas optimizacion que mejorando tu implementacion de LCS entre
>> > cada par.
>>
>> Sip, a los ~500k pares.  Para cada string quiero saber el vecino más
>> cercano dentro de la bolsa, es decir el que tenga la subcadena en
>> común más larga.
>>
>> --
>> Anthony Lenton
>> _______________________________________________
>> pyar mailing list pyar en python.org.ar
>> http://listas.python.org.ar/listinfo/pyar
>>
>> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>>
>
>
> Buenas,
>
> No probaste usar Levenshtein? En [0] hay un modulo en c.
>
> [0] http://code.google.com/p/pylevenshtein/
>
> --
> Lucas
>


Tambien podrias probar con el SequenceMatcher de difflib [0]

[0] http://docs.python.org/library/difflib.html#sequencematcher-objects

-- 
Lucas
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20100713/5a3b86c9/attachment.html>


More information about the pyar mailing list