[pyar] extraer texto de un html

Martin Cerdeira martincerdeira en gmail.com
Mie Nov 24 15:37:50 ART 2010


2010/11/24 Federico Heinz <fheinz en vialibre.org.ar>:
> On 24/11/2010, Martin Cerdeira wrote:
>> "Some people, when confronted with a problem, think "I know, I'll
>> use regular expressions." Now they have two problems."
>
> Lo que, por supuesto, sería cierto si la cita dijera "any problem" en
> vez de "a problem". Cuando el problema es parsear un lenguaje
> regular, las expresiones regulares son la solución ideal. Para
> todos los demás problemas (entre los cuales está el de extraer texto
> de un html), son todo lo contrario. Pero decir que las expresiones
> regulares son un problema en sí, es tan necio como querer usarlas
> para culquier cosa.
>
>        Fede
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>

El chiste es que, muchas veces las re son tán dificiles de armar o
debuggear que, generan ese 'segundo problema', a eso se refería jwz
[0]
 Por supuesto, debe ser tomado como una broma, nadie cuestiona el
poder[0] de las re (de hecho, fue mi sugerencia)
Saludos

[0] http://www.jwz.org/
[1] http://xkcd.com/208/
-------------------------------------
Martín Cerdeira - Software Developer
[web] http://www.codmacs.blogspot.com/
()  ascii ribbon campaign
/\  www.asciiribbon.org



More information about the pyar mailing list