[pyar] Expresiones regulares y el "Matches if ... doesn’t match next"

ken248000 en gmail.com ken248000 en gmail.com
Lun Nov 15 11:03:12 ART 2010


fijate si asi te sirve:

>>> re.sub('(<img[^>]+)[^/]>', '\g<1>/>', archivo)

agrego a lo de evitar el cthulhu way. yo lo tuve que aprender de la
peor forma...

con html puden pasar 1000 cosas, por eso necesitas una libreria que
este preparada para interpretar el codigo escrito por cualquiera.

por ejemplo en el patron que estas usando no comtemplas cuando pasa esto;

<img src="holaloco"></img>

entonces ahi te romperia ya que cambiaria por : <img src="holaloco"/></img>

el patron que te pase tiene en cuenta eso, pero suponiendo que hay un
atributo onclick="if(a > b): alert('explota todo')" me cago otra ves.

On Sun, Nov 14, 2010 at 9:51 PM, Francisco V.
<iseeprimenumbers en gmail.com> wrote:
> Para leer:
>
> http://www.codinghorror.com/blog/2009/11/parsing-html-the-cthulhu-way.html
>
> Quizás te sirva:
>
> http://www.crummy.com/software/BeautifulSoup/
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>



More information about the pyar mailing list