[pyar] Expresiones regulares y el "Matches if ... doesn’t match next"

N Cis n.cis_92 en hotmail.com
Mie Nov 17 23:44:50 ART 2010




también podés pegarle una mirada a esto

http://pyquery.org/


Que es una abstracción de lxml respetando la api de jquery (que es buenísima!)

Pero, el pyquery no arrojaria errores con htmls mal formulados?
 		 	   		  


Se conversó hace poco en la lista. buscalo. 

La respuesta es que lxml (pyquery es sólo un baño de chocolate sobre esta biblioteca)  tiene tolerancia a html roto tanto o más que beautifulsoup. 

acá un articulo de Ian Bicking, autor de pip, virtualenv  (entre otros soft famosos) y lxml.html  , la parte que hace esa tolerancia posible. 


http://blog.ianbicking.org/2008/12/10/lxml-an-underappreciated-web-scraping-library/


PD: Me equivoco o Bicking fue uno de los candidatos a venir a la pycon como invitado especial  y al final no pudo ser ?  

 


_______________________________________________
pyar mailing list pyar en python.org.ar
http://listas.python.org.ar/listinfo/pyar

PyAr - Python Argentina - Sitio web: http://www.python.org.ar/

Perdon por mi ignorancia, pero como busco en la lista de Pyar?, xD,,,
Entoncs, me recomendarian arrancar usando pyQuery (lxml) en vez del beautifulsoup?...

Saludos :P
 		 	   		  
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20101117/7ad16940/attachment.html>


More information about the pyar mailing list