[pyar] Expresiones regulares y el "Matches if ... doesn’t match next"
Martín Gaitán
gaitan en gmail.com
Mie Nov 17 22:58:38 ART 2010
2010/11/17 N Cis <n.cis_92 en hotmail.com>
>
> ------------------------------
>
> también podés pegarle una mirada a esto
>
> http://pyquery.org/
>
> Que es una abstracción de lxml respetando la api de jquery (que es
> buenísima!)
>
>
> Pero, el pyquery no arrojaria errores con htmls mal formulados?
>
>
Se conversó hace poco en la lista. buscalo.
La respuesta es que lxml (pyquery es sólo un baño de chocolate sobre esta
biblioteca) tiene tolerancia a html roto tanto o más que beautifulsoup.
acá un articulo de Ian Bicking, autor de pip, virtualenv (entre otros soft
famosos) y lxml.html , la parte que hace esa tolerancia posible.
http://blog.ianbicking.org/2008/12/10/lxml-an-underappreciated-web-scraping-library/
PD: Me equivoco o Bicking fue uno de los candidatos a venir a la pycon como
invitado especial y al final no pudo ser ?
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20101117/1f79f58b/attachment.html>
More information about the pyar
mailing list