[pyar] Web screenshot

Augusto adtononi en gmail.com
Jue Ene 9 08:22:30 -03 2020


Buenos días grupo,

Estoy queriendo obtener una screenshot de varios sitios. Actualmente lo
estoy haciendo con selenium y on demand, es decir que lo hago en el
instante que el usuario lo solicita en la página.
No me gusta mucho la idea de que se así ya que el usuario tendría que
esperar unos segundos hasta que este disponible la imagen y esto afecta a
su navegación dentro del sitio. Sin embargo, me permite obtener solo
aquellos que verdaderamente se requieren (ya que son miles de sitios,
podría generar miles al dope).
La otra opción es obtener las screenshots previamente y que ya estén
cargadas. El problema es que son miles, y con selenium no había podido
lograr que sea escalable, había procesos que no terminaban de morirse y
chau ram. Otro problema es que las páginas podrían tomarme como spam y
bloquear mi ip, ya que primero scrapeo las noticias de un sitio y luego
obtendría una captura de cada noticia.

Alguien afrontó algún problema similar? Debería dejar que sea on demand y
tratar de optimizar la respuesta?

Saludos!
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20200109/d40e6ae7/attachment.html>


Más información sobre la lista de distribución pyar