[pyar] Hola mundo y primera consulta con lxml.

Facundo Batista facundobatista en gmail.com
Jue Sep 9 12:57:05 ART 2010


2010/9/8 Matias Eduardo Bordone Carranza <mebordone en gmail.com>:

> El problema que estoy teniendo ahora es que me da la sensación que
> lxml me esta rompiendo de alguna forma la codificación de caracteres.
> Aclaro que a lo mejor estoy haciendo cualquiera y no tengo idea.

En general, odio XML y scrapeo poco paginas web, pero: los html
normalmente no son tan sanos como una biblioteca de xml desearía. No
me extraña ni un poquito que se te rompa.

Deberías usar alguna herramienta para procesar páginas web. Me han
hablado muy bien de BeautifulSoup, por ejemplo.

Slds.

-- 
.    Facundo

Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org/ar/



More information about the pyar mailing list