[pyar] Web data retrieve o choreando data a lo loco.
DF--
dj.foguelman en gmail.com
Sab Nov 13 19:50:34 ART 2010
Hola mundo!
Este es mi primer mail a la lista de hola mundo ¿y qué más piola que un mini
proyecto para q hagamos mail-storming?
--- De mi ---
Programador, estudio CS, hago tai chi, laburo con automation testing en
python.
--- Qué quiero hacer en python? ---
La idea es esta, hay varios portales de búsqueda de los cuales me interesan
determinados resultados. Cada cual tiene una interfaz de búsqueda distinta y
me gustaría poder extraer, con cierta periodicidad, los datos de cada
busqueda_i
La idea es usando la interfaz provista cada página parsear el resultado de
la búsqueda y guardar unos datos.
Un ejemplo de página a parsear es www.argenprop.com (verán q quiero mudarme
y no tengo ganas de buscar a mano x acá, me quiero hacer un feed o algo x el
estilo).
--- Unas preguntas ---
¿Se les ocurre una api para poder extraer contenido de un html con mínimo
esfuerzo? Estuve viendo BeautifulSoup aunque todavía no hice ninguna prueba.
Para extraer la interfaz web (en formato query string) se me ocurrió esnifar
los requests que se ejecutan la búsqueda, limpiarlos a mano y usarlos pero
me parece tedioso, ¿alguna idea pythonica?
Un gran saludo,
D.
"En economía no hay nada misterioso ni inaccesible al entendimiento del
hombre de la calle. Si hay un misterio, reside él en el oculto propósito que
puede perseguir el economista y que no es otro que la disimulación del
interés concreto a que se sirve."
A. Jauretche
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20101113/ea3a8d0d/attachment.html>
More information about the pyar
mailing list