[pyar] Leyendo archivo codificado como Latin1

Gustavo Campanelli gedece en gmail.com
Mar Mar 29 16:36:27 ART 2016


2016-03-11 20:06 GMT-03:00 Daniel Moisset <dmoisset en machinalis.com>:

> Chequeaste el resultado? algo que tiene latin1 es que cualquier secuencia
> de bytes es aceptable, con lo cual nunca va a dar error (que no
> necesariamente quiere decir que la decodificacion es correcta).
>
> Saludos,
>    D.
>
> 2016-03-11 19:43 GMT+01:00 Gustavo Campanelli <gedece en gmail.com>:
>
>> Tuve que leer un padrón que daba dump, me armé un programa en python con
>> un contador sencillo, que frenaba cuando tenía problemas al leer algo, y
>> luego comencé a jugar con la codificación. La correcta resultó ser Latin1,
>> que logró leer los más de 429000 registros.
>>
>> Amo Python por esto, el rápido prototipado de pequeños programas simples
>> y poderosos.
>>
>> import unicodedata
>> import codecs
>> cont = 0
>> arch = codecs.open('Padron.txt','r',encoding='LATIN-1')
>>
>> for linea in arch:
>> cont = cont + 1
>>
>> print cont
>>
>> Espero que les sirva para algún proyecto.
>>
>> Gedece
>>
>>
>> _______________________________________________
>> pyar mailing list pyar en python.org.ar
>> http://listas.python.org.ar/listinfo/pyar
>>
>> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>>
>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>> Argentina - http://www.usla.org.ar
>>
>
>
>
> --
> Daniel F. Moisset - Technical Leader
> www.machinalis.com
> Skype: @dmoisset
>
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
>

Luego de las vacaciones te agradezco la sugerencia, revisamos el padrón
imprimiendo las líneas problemáticas localizadas decodificándolas con
Latin1 y se leyeron bien.

Gedece
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160329/38603c05/attachment.html>


Más información sobre la lista de distribución pyar