[pyar] Expresiones regulares y el "Matches if ... doesn’t match next"

Martín Gaitán gaitan en gmail.com
Mie Nov 17 22:58:38 ART 2010


2010/11/17 N Cis <n.cis_92 en hotmail.com>

>
> ------------------------------
>
> también podés pegarle una mirada a esto
>
> http://pyquery.org/
>
> Que es una abstracción de lxml respetando la api de jquery (que es
> buenísima!)
>
>
> Pero, el pyquery no arrojaria errores con htmls mal formulados?
>
>
Se conversó hace poco en la lista. buscalo.

La respuesta es que lxml (pyquery es sólo un baño de chocolate sobre esta
biblioteca)  tiene tolerancia a html roto tanto o más que beautifulsoup.

acá un articulo de Ian Bicking, autor de pip, virtualenv  (entre otros soft
famosos) y lxml.html  , la parte que hace esa tolerancia posible.

http://blog.ianbicking.org/2008/12/10/lxml-an-underappreciated-web-scraping-library/


PD: Me equivoco o Bicking fue uno de los candidatos a venir a la pycon como
invitado especial  y al final no pudo ser ?
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20101117/1f79f58b/attachment.html>


More information about the pyar mailing list