[pyar] scrapyando páginas con javascript
Ramiro Morales
cramm0 en gmail.com
Mie Mar 19 18:43:52 ART 2014
2014-03-19 18:23 GMT-03:00 Jairo Trad <frodobolsonxx en gmail.com>:
> Vas a terminar haciendo el 2 en el 90% de los casos no tiene sentido
> levantar tanto overhead... empeza a hacerte amigo de firebug... o de ultima
> usa las herramientas que vienen incluidas en crome que son bastante buenas
> para eso.
Yo diría que esto depende de una combinación de:
a) Con que frecuencia y escala tenga que hacer el proceso de captura de datos.
b) Que tan intensivo en recursos sea el proceso asociado a una solución tipo 3.
c) Cuanto tiempo le lleve hacer una ingeniería inversa manual como la
de la opción 2
d) Con qué frecuencia estima que van a cambiar la implementación y
cuan future-proof quiere hacer la solución.
No decartaría la opción 3 con algo como PhantomJS y/o CasperJs que por
ahi te dan algunos dolores de cabeza (porque tiene sus limitaciones o
bugs medio locos) pero que si te funciona por ahi ayuda a que futuras
adaptaciones nosean tan laboriosas. Por ahi hay que sopesar que no
siempre a futuro va a haber un dev que pueda hacer la ingeniería
inversa de 2.
--
Ramiro Morales
@ramiromorales
More information about the pyar
mailing list