[pyar] Web screenshot

Ariel Gerardo Ríos arielgerardorios en gmail.com
Jue Ene 9 14:03:05 -03 2020


Hola Augusto:

La estrategia que elijas depende de qué objetivo quieras satisfacer. Si a
nadie le jode esperar unos segundos por la imagen on demand, dejalo así;
funciona. Si estás teniendo feedback de que los usuarios les jode los
tiempos del sitio y eso perjudica que el user se quede en la plataforma por
ej, entonces es algo a atacar.

Saludos!




El jue., 9 de ene. de 2020 a la(s) 08:22, Augusto (adtononi en gmail.com)
escribió:

> Buenos días grupo,
>
> Estoy queriendo obtener una screenshot de varios sitios. Actualmente lo
> estoy haciendo con selenium y on demand, es decir que lo hago en el
> instante que el usuario lo solicita en la página.
> No me gusta mucho la idea de que se así ya que el usuario tendría que
> esperar unos segundos hasta que este disponible la imagen y esto afecta a
> su navegación dentro del sitio. Sin embargo, me permite obtener solo
> aquellos que verdaderamente se requieren (ya que son miles de sitios,
> podría generar miles al dope).
> La otra opción es obtener las screenshots previamente y que ya estén
> cargadas. El problema es que son miles, y con selenium no había podido
> lograr que sea escalable, había procesos que no terminaban de morirse y
> chau ram. Otro problema es que las páginas podrían tomarme como spam y
> bloquear mi ip, ya que primero scrapeo las noticias de un sitio y luego
> obtendría una captura de cada noticia.
>
> Alguien afrontó algún problema similar? Debería dejar que sea on demand y
> tratar de optimizar la respuesta?
>
> Saludos!
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar



-- 
Ariel Gerardo Ríos
linkedin <http://www.linkedin.com/pub/ariel-gerardo-rios/33/158/227> | *blog
<http://www.ariel17.com.ar>*
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20200109/dd1b6f87/attachment-0001.html>


Más información sobre la lista de distribución pyar