[pyar] Scraping de ML
Emiliano Vazquez
emilianovazquez en gmail.com
Lun Jul 23 23:14:26 -03 2018
Hola a todos, estoy con ganas de poder leer de mercadolibre el precio de
las viviendas de 2 ambientes en la zona de mataderos/lugano en CABA, es
donde vivo yo. No quiero discutir temas politicos o de ideología, solamente
estoy buscando como encaminarme, el codigo va a ser abierto y lo voy a
alojar en github, pero todavia estoy pensando como hacerlo y obviamente,
que me tiren todas las cosas malas que harían que esto que estoy pensando
sea algo imposible, mis objetivos:
* definir la zona de busqueda, como es sabido no todos los bienes tienen el
mismo precio, por ende buscar en todos lados no tendría sentido. despues
quizas el codigo se amplie a otras zonas, pero no quiero ir por algo
gigante si no por algo que por mis capacidades y tiempo pueda realizar.
* definir un tamaño de la propiedad, para tener en el mix de precios una
cualidad que con la zona dan un precio promedio bastante real, entiendo que
la calidad del bien va a influir, pero es algo que no veo como solucionarlo.
* lograr tener el dato de un ID de mercadolibre y su evolucion en el
tiempo, nunca seguí un item de mercadolibre, pero me imagino que una
publicacion mantiene sus datos y ante una renovación de la publicacion +
cambio de precio voy a mantener el ID que viene en el mismo.
* con los datos juntados poder seguir el conjunto de precios en el tiempo y
la relacion precio dolar/pesos que va llevanto, de nuevo, me guardo mis
ideas de como seria esta relacion en el tiempo, no intento discutir o
generar una guerra en la lista, solamente jugar un rato con datos.
* Me encontre con este link que tiene un poco de info de Scrapy y ML, voy a
buscar mas, pero es lo primero a lo que he llegado.
Mis dudas:
* No se si usar Scrapy o si hay algo mejor que exista por ahi.
* Desconozco si ML me va a cortar las peticiones por abuso.
* No se si ya existe alguna herramienta similar disponible y de codigo
abierto
* No se si esto que hago es ilegal (no creo pero no esta de mas la pregunta)
Problemas:
* Quiero googlear "python scrap mercadolibre" y termino en la web de
mercadolibre para comprar libros de python jajajaa
No quiero escribir mucho mas, ya que puede pasar que este e-mail no tenga
repercusión.
Les mando un saludo a todos y que terminen bien el día!
Emiliano.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20180723/caa690e7/attachment-0001.html>
Más información sobre la lista de distribución pyar