[pyar] extraer texto de un html

Sebastian Bassi sbassi en clubdelarazon.org
Mie Nov 24 15:55:26 ART 2010


2010/11/24 gustavo c <p8queen en gmail.com>

> te recomiendo que aprendas expresiones regulares.
> vos necesitas el texto que matchea <div>cualquirCosa</div>
> te dejo un link con ejemplos simples:
> http://mundogeek.net/archivos/2008/04/09/python-expresiones-regulares/
>

Creo que usar regex para estas cosas es reinventar la rueda. Las libs que
sugirieron aca usan regex para que nosotros no tengamos que hacerlo. El
ejemplo que dio David puede ser trivial, pero el HTML acepta mas cosas que
las que se ven "a simple vista" (espacios, tabs y retornos de carro como si
fuesen lo mismo) y ni hablar si ademas incluimos HTML malformado (con tags
que se cierran donde no corresponde, o que se anidan mas, etc).
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20101124/358653fd/attachment.html>


More information about the pyar mailing list