[pyar] extraer texto de un html

Ricardo Daniel Quiroga l2radamanthys en gmail.com
Mie Nov 24 13:05:09 ART 2010


2010/11/24 David Moreno <lamenteel en gmail.com>

>  hola
>
>     quiero recuperar de un html un texto, el texto en si siempre está entre
> dos etiquetas html. no se si me explico bien, pongo un ejemplo bastante
> simple
>
> <head>
>     texto
> </head>
> <body>
>     texto
>     <div>
>         texto que quiero recuperar
>     </div>
>     texto
> </body>
>


ehh sgmllib.SGMLParser te suena... :P yo uso eso para extraer el texto de
los HTML, en realidad saca cualquier cosa que este en medio de los tags
usando handle_data()...
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20101124/7ea4f23a/attachment.html>


More information about the pyar mailing list