[pyar] Seleccionar elementos de un txt

Andrés Gattinoni andresgattinoni en gmail.com
Mar Ene 31 12:01:28 ART 2012


2012/1/31 Javier Castrillo <riverplatense en gmail.com>:
> Sea el siguiente problema:
> Tengo un archivo wordlist.txt con un diccionario completo español
>
> a
> abad
> abadí
> abadía
> ...
>
> Tengo que parsear ese archivo y sacar las palabras que tengan
> caracteres acentuados y con ñ.
>
> Intento con:
>
> http://pastebin.com/5YK92K2H
>
> y cuando compara nunca matchea por alguna razón. Le metí los print
> para ver qué pasaba y la cuestión es que en vez de comparar por caso
> con 'á' lo hace con '\x12345' o como sea que se escriba en Unicode,
> por lo tanto nunca encontrará igualdad.
>
> Cómo se puede solucionar eso?

Si probás haciendo que los strings de "malas" no sean unicode o
convirtiendo a unicode los strings del file que comparás?



More information about the pyar mailing list