[pyar] Diferencia en Unicode entre DB y HTML

Sebastian Bassi sebastian.bassi en globant.com
Mar Jun 21 14:26:47 ART 2016


Me autocontesto porque creo que encontre la respuesta:

title_in_db.decode('utf-8') == html_header_title.text

2016-06-21 10:20 GMT-07:00 Sebastian Bassi <sebastian.bassi en globant.com>:

> Estoy comparando 2 cadenas que deberían ser iguales pero resulta que están
> encodeadas distinto en la página HTML y en la base (Postgre) donde está la
> información. Mi duda es como "normalizar" o que me aconsejan para poder
> establecer una comparación (deberian ser iguales). Podria trabajar tanto en
> que quede igual en la DB que como lo recupero luego del HTML o podria hacer
> algo para que con los hechos consumados me identifique que se trata de lo
> mismo.
>
> (Pdb) html_header_title.text
> u'Evidence of a bacterial receptor for lysozyme: Binding of lysozyme to
> the anti-\u03c3 factor RsiV controls activation of the ECF \u03c3 factor
> \u03c3V'
> (Pdb) title_in_DB
> 'Evidence of a bacterial receptor for lysozyme: Binding of lysozyme to the
> anti-\xcf\x83 factor RsiV controls activation of the ECF \xcf\x83 factor
> \xcf\x83V'
>
> Si de algo les sirve, aca es como se ve el título en el HTML:
>
> Evidence of a bacterial receptor for lysozyme: Binding of lysozyme to the
> anti-σ factor RsiV controls activation of the ECF σ factor σV
>
> ​Y captura del mismo, es lo que está en verde:
>
> http://imgur.com/9vdQTTS​
>
>
> --
> Sebastián Bassi. sebastian.bassi en globant.com
> Lic. en Biotecnología con orientación en genética molecular.
>
>


-- 
Sebastián Bassi. sebastian.bassi en globant.com
Lic. en Biotecnología con orientación en genética molecular.
PreSales Consultant @ Globant.

-- 


The information contained in this e-mail may be confidential. It has been 
sent for the sole use of the intended recipient(s). If the reader of this 
message is not an intended recipient, you are hereby notified that any 
unauthorized review, use, disclosure, dissemination, distribution or 
copying of this communication, or any of its contents, 
is strictly prohibited. If you have received it by mistake please let us 
know by e-mail immediately and delete it from your system. Many thanks.

 

La información contenida en este mensaje puede ser confidencial. Ha sido 
enviada para el uso exclusivo del destinatario(s) previsto. Si el lector de 
este mensaje no fuera el destinatario previsto, por el presente queda Ud. 
notificado que cualquier lectura, uso, publicación, diseminación, 
distribución o copiado de esta comunicación o su contenido está 
estrictamente prohibido. En caso de que Ud. hubiera recibido este mensaje 
por error le agradeceremos notificarnos por e-mail inmediatamente y 
eliminarlo de su sistema. Muchas gracias.

------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160621/198fca95/attachment.html>


Más información sobre la lista de distribución pyar