[pyar] Resumen de pyar, Vol 75, Envío 74

sistemas sistemas en devas.com
Jue Mayo 26 20:17:37 ART 2016


Todo es depende la estructura, requests y beautifulsoup va muy bien.


Enviado desde mi smartphone Samsung Galaxy.-------- Mensaje original --------De: pyar-request en python.org.ar Fecha: 5/26/2016  20:08  (GMT-03:00) A: pyar en python.org.ar Asunto: Resumen de pyar, Vol 75, Envío 74 
Envíe los mensajes para la lista pyar a
	pyar en python.org.ar

Para subscribirse o anular su subscripción a través de la WEB
	http://listas.python.org.ar/listinfo/pyar

O por correo electrónico, enviando un mensaje con el texto "help" en
el asunto (subject) o en el cuerpo a:
	pyar-request en python.org.ar

Puede contactar con el responsable de la lista escribiendo a:
	pyar-owner en python.org.ar

Si responde a algún contenido de este mensaje, por favor, edite la
linea del asunto (subject) para que el texto sea mas especifico que:
"Re: Contents of pyar digest...". Además, por favor, incluya en la
respuesta sólo aquellas partes del mensaje a las que está
respondiendo.


Asuntos del día:

   1. Re: Scrapear boletin oficial (Cristian Cabrera)
   2. Re: Scrapear boletin oficial (Sebastián Seba)
   3. Re: [django] RestFramework,	llenar serializer con varios
      modelos (Daniel)
   4. Re: Archivos txt (Cristian Ariel Baez)


----------------------------------------------------------------------

Message: 1
Date: Thu, 26 May 2016 16:01:54 -0300
From: Cristian Cabrera <surrealcristian en gmail.com>
To: Python Argentina <pyar en python.org.ar>
Subject: Re: [pyar] Scrapear boletin oficial
Message-ID:
	<CAN9tWHZiKW6VrkUGR7TcXbVFZvxiJLBZh-Or3GZ4zNce7w0MMw en mail.gmail.com>
Content-Type: text/plain; charset="utf-8"

Yo iría por el lado de requests + lxml.
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160526/273e130d/attachment-0001.html>

------------------------------

Message: 2
Date: Thu, 26 May 2016 16:18:21 -0300
From: Sebastián Seba <ssebastianj en gmail.com>
To: Python Argentina <pyar en python.org.ar>
Subject: Re: [pyar] Scrapear boletin oficial
Message-ID:
	<CAJCiPDxpKsibpLmxgcThn6zg9-PjfG44h4ohzbLN+GPt7wfC6g en mail.gmail.com>
Content-Type: text/plain; charset="utf-8"

El 26 de mayo de 2016, 15:41, requisitos minimos <rminimos en gmail.com>
escribió:

> Hola buenas tardes,
>
> Estoy con ganas de scrapear el boletin oficial de ARGENTINA
>
> https://www.boletinoficial.gob.ar/
>
> De la primera seccion necesitariia "chupar" los siguientes datos
> nombre y apellido
> dni
> ministerio
> + una condicion laboral
>
> Que consideran lo mejor?
> Python + scrapy
> python +  Beautiful Soup
> Otra opcion
>
> Mi experiencia en python es limitada , complete hace un tiempo el
> tutorial learn python the hard way y despues no tuve mas tiempo para
> experimentar.
>
> Por ende valoro mas que el script funciona y listo , no me importa si
> no es con la herramienta mas modernosa con todo el hype , etc
>
> Les dejo mi email para gtalk rminimos en gmail.com
>
> Gracias por la orientacion
> SALUDOS
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar


Hola, dado que recién comenzás, yo empezaría desde lo más básico hasta
llegar a algo más elaborado, algo como:

1°) Instalar Jupyter [0] e iniciar una nueva consola o notebook.
2°) Dentro de una consola de Jupyter (o notebook)
    2.1) Probar el scraping con requests [1] + pyquery (BeautifulSoup es
otra alternativa)
    2.2) Probar el scraping con Scrapy.
3°) Consolidar todo en algún script (y algunos tests)
4°) ¡Disfrutar!

Según algunos hay un manual del "buen scrapeador" del estilo "no realizarás
demasiadas requests seguidas al servidor" y así :P

Saludos.

[0] jupyter.readthedocs.io
[1] http://docs.python-requests.org/en/master/

-- 
Sebastián J. Seba (ssebastianj)
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160526/858496de/attachment-0001.html>

------------------------------

Message: 3
Date: Thu, 26 May 2016 16:27:13 -0300
From: Daniel <dmlistapython en gmail.com>
To: Python Argentina <pyar en python.org.ar>
Subject: Re: [pyar] [django] RestFramework,	llenar serializer con
	varios modelos
Message-ID:
	<CAGS+azVGb8+aoTkoLYRt0x_texLi18JsXKFnN-=OG93Wd7yRMw en mail.gmail.com>
Content-Type: text/plain; charset="utf-8"

Muchas gracias Lucas por tu tiempo!
funcionó muy bien, repetí el concepto anidándolo y logré hacerlo con tu
receta.
no conocía SerializerMethodField
¡Gracias!


El 26 de mayo de 2016, 12:10, Lucas Godoy <2lucasg en gmail.com> escribió:

> On May 26, 2016 at 08:54:33, Daniel (dmlistapython en gmail.com) wrote:
>
> ¿Cómo cargo el queryset con el serializer que hice?
>
>
> Quizas, en el mismo serializer, podes usar
> serializers.SerializerMethodField
> para definir como sacar las categorías de cada ciudad. Y luego serializar
> esas categorias con el serializer que ya tenes.
>
> Aca se ve mejor http://pastebin.com/hPJjJTWz. También quizás, podrías
> hacerlo un ModelSerializer al ultimo para ahorrarte de definir los campos.
>
> Saludos!
> --
> Lucas
>
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
>



-- 
Daniel Malisani
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160526/bae47361/attachment-0001.html>

------------------------------

Message: 4
Date: Thu, 26 May 2016 20:08:14 -0300
From: Cristian Ariel Baez <haztulojusto en gmail.com>
To: Python Argentina <pyar en python.org.ar>
Subject: Re: [pyar] Archivos txt
Message-ID:
	<CAAOcjONyVy-=YSeqBkbPouhtUNzMLDa-w+DMMBiagK8BfdxAsA en mail.gmail.com>
Content-Type: text/plain; charset="utf-8"

ok gracias

El 26 de mayo de 2016, 15:11, Carlos Miguel FARIAS <
carlosmiguelfarias en gmail.com> escribió:

> Uso pycharm, use pyscript, el problema no es del editor, descarta el virus
> que oculta los archivos enmascarandolos con un acceso directo.
> Eso lo sufrimos nosotros el año pasado con los trabajos prácticos de los
> estudiantes en la Facultad.
> Podes recuperarlo, listando el directorio de origen mostrando los archivos
> ocultos, le quitas la marca de oculto y borras los accesos directos.
> Y ACTUALIZA EL ANTIVIRUS
> Saludos: Miguel, Santa Rosa (LP)
>
> El 26 de mayo de 2016, 12:10, Cristian Ariel Baez <haztulojusto en gmail.com>
> escribió:
>
>> Uso PyScripter y tambien descarge Pycharm y en ambos tengo el mismo
>> problema
>>
>> El 26 de mayo de 2016, 8:24, Carlos Miguel FARIAS <
>> carlosmiguelfarias en gmail.com> escribió:
>>
>>> Puede ser el virus ese que oculta el archivo de datos real y crea un
>>> acceso directo al mismo, de esa manera, cuando copias el archivo, en
>>> realidad copias el acceso directo
>>> Cuando intentas abrirlo en una máquina distinta, el acceso directo no
>>> encuentra el archivo correspondiente, porque no lo copiaste.
>>> Saludos: Miguel, Santa Rosa (LP)
>>>
>>> El 25 de mayo de 2016, 18:19, Rafael E. Ferrero <
>>> rafael.ferrero en gmail.com> escribió:
>>>
>>>> Es raro che, nunca me paso algo así ¿habrás perdido los archivos
>>>> ocultos del projecto que generan los IDE?, y de paso ¿Qué IDE estás usando?
>>>>
>>>>
>>>> Rafael E. Ferrero
>>>>
>>>> El 25 de mayo de 2016, 12:10, Cristian Ariel Baez <
>>>> haztulojusto en gmail.com> escribió:
>>>>
>>>>> Tengo un problema con dos IDEs que e descargado y en las pc de la
>>>>> universidad donde estudio esta el mismo problema cuando quiero abrir un
>>>>> archivo me debuelve que el archivo o directorio no esiste. Les a pasado a
>>>>> alguien lo mismo?
>>>>>
>>>>> Antes este problema no lo tenia y ahora me aparese en las dos notbook
>>>>> que tengo
>>>>>
>>>>> Tambien queria desir FELIZ 25 DE MAYO  para todos
>>>>>
>>>>> _______________________________________________
>>>>> pyar mailing list pyar en python.org.ar
>>>>> http://listas.python.org.ar/listinfo/pyar
>>>>>
>>>>> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>>>>>
>>>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>>>> Argentina - http://www.usla.org.ar
>>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> pyar mailing list pyar en python.org.ar
>>>> http://listas.python.org.ar/listinfo/pyar
>>>>
>>>> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>>>>
>>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>>> Argentina - http://www.usla.org.ar
>>>>
>>>
>>>
>>> _______________________________________________
>>> pyar mailing list pyar en python.org.ar
>>> http://listas.python.org.ar/listinfo/pyar
>>>
>>> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>>>
>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>> Argentina - http://www.usla.org.ar
>>>
>>
>>
>> _______________________________________________
>> pyar mailing list pyar en python.org.ar
>> http://listas.python.org.ar/listinfo/pyar
>>
>> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>>
>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>> Argentina - http://www.usla.org.ar
>>
>
>
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160526/f8560062/attachment.html>

------------------------------

Subject: Pié de página del digest

_______________________________________________
pyar mailing list
pyar en python.org.ar
http://listas.python.org.ar/listinfo/pyar

PyAr - Python Argentina - Sitio web: http://www.python.org.ar/


------------------------------

Fin de Resumen de pyar, Vol 75, Envío 74
*****************************************
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160526/b60adaab/attachment-0001.html>


Más información sobre la lista de distribución pyar