[pyar] extraer texto de un html

Lautaro Pecile lautaro.pecile en gmail.com
Mie Nov 24 15:53:27 ART 2010


Hola:

Puede ser que esto sea lo que necesitás?

>>> import HTMLParser
>>> class TextStripper(HTMLParser.HTMLParser):
...     def __init__(self):
...         self.reset()
...         self.fed = []
...
...     def handle_data(self, d):
...         self.fed.append(d)
...
...     @property
...     def get_text(self):
...         return ''.join(self.fed)
...
>>> x = TextStripper()
>>> x.feed(<string con html>)
>>> x.get_text

Saludos

Lautaro



More information about the pyar mailing list