[pyar] Categorizar páginas

Augusto Tononi adtononi en gmail.com
Mie Mar 14 16:21:18 -03 2018


Buen día gente

Necesito ayuda para tagear páginas. Tengo unas 42 mil páginas en un CSV. El
trabajo consiste en entrar a las páginas, ver de que trata y tagearla en el
programa del laburo. A su vez también se entra a las distintas
sub-categorías que tiene cada páginas. Todo esto manual.
Si sigo así voy a terminar el año que viene, con suerte. Así que se me
ocurrio hacer un spider para realizar web scraping, lo cual ya estuve
probando de curioso en otra ocasión. Ustedes lo ven muy viable? O conocen
alguna otra forma de realizarlo?
El spider sería para que me categorice las páginas y sus subdominios, y
después si hacer la carga manual (es la única forma) en el programa del
laburo.

Saludos
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20180314/6ef65175/attachment.html>


Más información sobre la lista de distribución pyar