[pyar] extraer texto de un html
Lautaro Pecile
lautaro.pecile en gmail.com
Mie Nov 24 15:53:27 ART 2010
Hola:
Puede ser que esto sea lo que necesitás?
>>> import HTMLParser
>>> class TextStripper(HTMLParser.HTMLParser):
... def __init__(self):
... self.reset()
... self.fed = []
...
... def handle_data(self, d):
... self.fed.append(d)
...
... @property
... def get_text(self):
... return ''.join(self.fed)
...
>>> x = TextStripper()
>>> x.feed(<string con html>)
>>> x.get_text
Saludos
Lautaro
More information about the pyar
mailing list