[pyar] Mi versión de la charla de Unicode

Sebastian Bassi sebastian.bassi en globant.com
Lun Sep 19 00:50:33 ART 2016


2016-09-17 5:27 GMT-07:00 Fernando Pelliccioni <fpelliccioni en gmail.com>:

> Muy buena presentación!
>
> Una pequeña corrección:
> "UTF-16: Supports all chars. 2 bytes per char (plus BOM)"
>
> Por: "...2 bytes per code unit...".
>
> En UTF-16 los code units son de 16 bits, los code points pueden estar
> formados por 1 o 2 code units (16 o 32 bits, variable length encoding).
> Un caracter en general está "encodeado" con un sólo code point, pero hay
> casos en los cuales se necesita más de un code point para encodear un
> caracter.
>
> ​No tenia clara la diferencia entre code points y code unit. Cuando decis
que un code point está formado por 1 o 2 code units, me podes dar un
ejemplo? ¿Te referis a cosas como que la ñ se forma con n y ~ u otra cosa?​


> UTF-8 Y UTF-32 también soportan todos los caracteres.
>
> No sé si oralmente hacés mención, pero quizás sea interesante decir cual
> el  encoding usado en la representación interna de strings en CPython.
> Antes de CPython 3.3 usaban UCS-2¿? y a partir de 3.3 comienzan a usar lo
> propuesto por el PEP393.
>
> http://legacy.python.org/dev/peps/pep-0393/
>

​Hay cosas que no están en la presentación escrita pero si las dije, pero
esa especificamente no porque para entrarla en 30 minutos algo tenia que
dejar afuera, por lo que saqué la mayoría de las internals de Python (habia
que priorizar).

Gracias por el feedback.​

-- 


The information contained in this e-mail may be confidential. It has been 
sent for the sole use of the intended recipient(s). If the reader of this 
message is not an intended recipient, you are hereby notified that any 
unauthorized review, use, disclosure, dissemination, distribution or 
copying of this communication, or any of its contents, 
is strictly prohibited. If you have received it by mistake please let us 
know by e-mail immediately and delete it from your system. Many thanks.

 

La información contenida en este mensaje puede ser confidencial. Ha sido 
enviada para el uso exclusivo del destinatario(s) previsto. Si el lector de 
este mensaje no fuera el destinatario previsto, por el presente queda Ud. 
notificado que cualquier lectura, uso, publicación, diseminación, 
distribución o copiado de esta comunicación o su contenido está 
estrictamente prohibido. En caso de que Ud. hubiera recibido este mensaje 
por error le agradeceremos notificarnos por e-mail inmediatamente y 
eliminarlo de su sistema. Muchas gracias.

------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160918/4d460a4c/attachment-0001.html>


Más información sobre la lista de distribución pyar