[pyar] extraer texto de un html
Ricardo Daniel Quiroga
l2radamanthys en gmail.com
Mie Nov 24 13:05:09 ART 2010
2010/11/24 David Moreno <lamenteel en gmail.com>
> hola
>
> quiero recuperar de un html un texto, el texto en si siempre está entre
> dos etiquetas html. no se si me explico bien, pongo un ejemplo bastante
> simple
>
> <head>
> texto
> </head>
> <body>
> texto
> <div>
> texto que quiero recuperar
> </div>
> texto
> </body>
>
ehh sgmllib.SGMLParser te suena... :P yo uso eso para extraer el texto de
los HTML, en realidad saca cualquier cosa que este en medio de los tags
usando handle_data()...
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20101124/7ea4f23a/attachment.html>
More information about the pyar
mailing list