[pyar] Unicode, str y archivos binarios...

Alejandro Santos listas en alejolp.com
Vie Mar 15 11:46:08 ART 2013


2013/3/14 Santiago Paleka <santiagopaleka en gmail.com>:
>
> UnicodeDecodeError: 'utf8' codec can't decode byte 0xaa in position 0:
> invalid start byte
>
> Lo que yo quisiera, en el ejemplo anterior, es obtener en binario = 0xAA
> 0x04 0x05 0xE1 0XE9 0XED 0XF3 0XFA
>

0xFA es la letra 'u' acentuada en la codificación ISO-5589-1 (aka
"Latin1") y familia (ISO-8859-15 por ejemplo). En UTF-8 las letras
acentuadas ocupan dos bytes:

>>> print repr((u"ú").encode("latin1"))
'\xfa'
>>> print repr((u"ú").encode("iso-8859-1"))
'\xfa'
>>> print repr((u"ú").encode("iso-8859-15"))
'\xfa'
>>> print repr((u"ú").encode("utf8"))
'\xc3\xba'

--
Alejandro Santos



More information about the pyar mailing list