[pyar] scrapyando páginas con javascript

Ramiro Morales cramm0 en gmail.com
Mie Mar 19 18:43:52 ART 2014


2014-03-19 18:23 GMT-03:00 Jairo Trad <frodobolsonxx en gmail.com>:
> Vas a terminar haciendo el 2 en el 90% de los casos no tiene sentido
> levantar tanto overhead... empeza a hacerte amigo de firebug... o de ultima
> usa las herramientas que vienen incluidas en crome que son bastante buenas
> para eso.

Yo diría que esto depende de una combinación de:

a) Con que frecuencia y escala tenga que hacer el proceso de captura de datos.
b) Que tan intensivo en recursos sea el proceso asociado a una solución tipo 3.
c) Cuanto tiempo le lleve hacer una ingeniería inversa manual como la
de la opción 2
d) Con qué frecuencia estima que van a cambiar la implementación y
cuan future-proof quiere hacer la solución.

No decartaría la opción 3 con algo como PhantomJS y/o CasperJs que por
ahi te dan algunos dolores de cabeza (porque tiene sus limitaciones o
bugs medio locos) pero que si te funciona por ahi ayuda a que futuras
adaptaciones nosean tan laboriosas. Por ahi hay que sopesar que no
siempre a futuro va a  haber un dev que pueda hacer la ingeniería
inversa de 2.

-- 
Ramiro Morales
@ramiromorales


More information about the pyar mailing list