[pyar] UnicodeDecodeError

Facundo Batista facundobatista en gmail.com
Mie Jul 8 11:18:10 ART 2015


2015-07-08 11:02 GMT-03:00 Alejandro Mazzuca <amazzuca en hotmail.com>:

> 1. extraigo texto de un archivo de texto que contiene acentos y caracteres
> latinos.

En este paso, ¿tenés bytes o unicode? Deberías tener unicode. Hacé un
print(repr(tutexto)) y contanos qué ves (y también decinos si estás en
Py 2 o 3).


> 2. Proceso y ordeno el texto

Perfecto.


> 3. Necesito agregar ese texto en otro archivo, pero durante el proceso me
> convierte los caracteres latinos a formato (UNICODE?) ej \xb3 para la ó

Los archivos sólo contienen bytes, no podés grabar Unicode en un
archivo de la misma manera que no podés grabar un sillón.

Necesitás codificarlo. La manera más fácil es abrir el archivo
indicando un encoding directamente, en Py2 lo hacés con codecs.open, y
en Py3 con el parámetro encoding del open.

Slds.

-- 
.    Facundo

Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org/ar/
Twitter: @facundobatista


More information about the pyar mailing list