[pyar] Consulta Web Scraping

Roberto Perdomo robertop23 en gmail.com
Lun Ago 28 16:51:54 ART 2017


Pueden utilizar Selenium también.

Con selenium puedes utilizar Chromedriver, PhantomJS,  Firefox,  entre
otros.

Pero si la página no requiere hacer uso de un navegador lo más simple es
utilizar Urllib con BeatifulSoup.

También está por allí mechanize

El 28 ago. 2017 3:45 PM, "Alessandro Odetti" <aodetti en gmail.com> escribió:

> Lucho, tmb te recomiendo Scrapy[1],
> Si estas acostumbrado a los selectores CSS, no tenes que aprender XPath y
> sale solo :D
>
> [1]: https://scrapy.org/
>
> 2017-08-28 16:43 GMT-03:00 carlos <mardeltux en gmail.com>:
>
>> Yo estuve probando/aprendiendo con beatifullsoap y me gusto mucho.
>>
>> El 28 ago. 2017 16:31, "Lucho Martingaste" <martingasteluciano en gmail.com>
>> escribió:
>>
>>> Buenas tardes, alguien sabe como sacar información, de noticias es decir
>>> fragmento de texto lo necesito, para analizar datos, a través de un modulo
>>> de machine learning.
>>>
>>> Muchas gracias desde ya.
>>>
>>>
>>>
>>> _______________________________________________
>>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>>> Sitio web: http://www.python.org.ar/
>>>
>>> Para administrar la lista (o desuscribirse) entrar a
>>> http://listas.python.org.ar/listinfo/pyar
>>>
>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>> Argentina - http://www.usla.org.ar
>>>
>>
>> _______________________________________________
>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>> Sitio web: http://www.python.org.ar/
>>
>> Para administrar la lista (o desuscribirse) entrar a
>> http://listas.python.org.ar/listinfo/pyar
>>
>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>> Argentina - http://www.usla.org.ar
>>
>
>
>
> --
> *- Alessandro Odetti -   *
>
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20170828/21bc97e1/attachment.html>


Más información sobre la lista de distribución pyar