[pyar] Unicode, XMLs y minidom

Roberto Alsina ralsina en netmanagers.com.ar
Jue Sep 12 06:56:49 ART 2013


On 12/09/13 01:59, Federico Manuel Echeverri Choux wrote:
> Bueno gente Efectivamente el gedit esta metiendo algo ( *\ufeff ),
> *cuando lo abri con el vim impresionante me mostro ese algo, lo quite
> y todo quedo perfecto. Mañana hago mas pruebas y intentar aprende a
> usar VIM, no me gusta mucho pero veo que esta muy bueno.
> Nhomar tendre que usar VIM    
>

Eso que "te aparece" es lo que se llama el BOM utf-8. Cuando guardás un
archivo como encoding UTF-8 es opcional poner esos 3 bytes al principio.
Algunos editores lo ponen, otros no. Está bien en ambos casos!

El problema es tener un editor que pone el BOM y después abrir el
archivo, no como UTF-8, si no como ASCII o LATIN-1, que no llevan BOM.
Entonces terminás con un archivo con 3 bytes raros al principio. Si
después agarrás esos datos con los 3 bytes de más y los pegás con más
datos, no te quedan en el principio y tenés un archivo roto.

O sea, podés hacer varias cosas:

1) Fijarte quien te está poniendo el BOM y hacer que no lo haga
2) Fijarte quen está leyendo el archivo sin tener en cuenta el BOM y
hacer que se de cuenta
3) Fijarte quien está leyendo el archivo UTF-8 como no-UTF-8 y hacerlo bien

Con 1) probablemente se te vaya el síntoma, pero el bug son 2 y/o 3.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20130912/526b014d/attachment.html>


More information about the pyar mailing list