[pyar] Codecs, UTF-8

Martin Cerdeira martincerdeira en gmail.com
Mie Oct 13 12:04:21 ART 2010


2010/10/13 Facundo Batista <facundobatista en gmail.com>:
> El open es imposible que te de un error. El codecs.open sí puede,
> porque está haciendo una conversión.
> ¿Estás seguro que ese archivo que estás queriendo abrir está en UTF8?

Si, ya está, era el tilde en el nombre del path. Tenías razón, no era el open.

>> # -*- coding: utf-8 -*-
>
> Deberías saber qué encoding poner ahí, y no empezar a cambiarlos hasta
> que algo funcione. El encoding que tenés que poner ahí es el que está
> usando tu procesador de texto.

Si, ya lo sé, eran pruebas nomás. Perdón!  =)

>> string = "ñandú"
>
> Nunca pongas caracteres no-ASCII en strings no-Unicode. Poné así:
>
>  string = u"ñandú"

Supongamos que en vez de estar la palabra 'ñandú' hardcodeada la
obtengo de leer, el contenido de un archivo. Si lo imprimo por
pantalla, va a salir, no se, capaz bien, capaz no.
A lo que quería llegar es, cuál es la forma de (si existe) mostrar
bien los tildes, ñ y demás caracteres latinos, más allá de toda
configuración? Cómo me *aseguro*, desde python, de mostrarlo
correctamente?

En el ejemplo concreto (del último post) hice:

print unicode(string,"latin1")

Pero, es la mejor? hay otra? Estimo que, no es la mejor, ya que se me
ocurrió a mi =)

Gracias por todo.
-------------------------------------
Martín Cerdeira - Software Developer
[web] http://www.codmacs.blogspot.com/
()  ascii ribbon campaign
/\  www.asciiribbon.org



More information about the pyar mailing list