[pyar] Pocesando un texto proveniente de un sitio web

Gustavo Campanelli gedece en gmail.com
Sab Feb 24 13:34:47 -03 2018


datos = '1\tA\n2\tB\n3\tC\n4\tD'

print(datos.split('\n'))

['1\tA', '2\tB', '3\tC', '4\tD']



2018-02-24 13:25 GMT-03:00 Jose Jachuf <jjachuf en gmail.com>:

> Hola
>
> [python3 + requests]
>
> Estoy recuperando unos datos de una web de terceros usando requests. Los
> datos viene estructurados de esta manera:
>
> 1\tA\n2\tB\n3\tC\n4\tD
>
> al menos es lo que veo en el browser. El content-type es: text/html;
> charset=iso-8859-1
>
> >>> r = requests.post(URL, data=payload)
> >>> datos = r.text
>
> >>> print(type(datos))
> <class 'str'>
>
> >>> print(datos)
> 1\tA\n2\tB\n3\tC\n4\tD
>
> Lo que quiero es obtener una lista de con los registros usando
> datos.split('\n'), pero esto no sucede
>
> >>> rows = datos.split('\n')
> >>> len(rows)
> 1
>
> >>> datos.find('\n')
> -1
>
> >>> datos2 = '1\tA\n2\tB\n3\tC\n4\tD'
> >>> datos == datos2
> False
>
>
> Probé:
>
> 1) Guardar datos en un archivo y definitivamente este contiene:
> 1\tA\n2\tB\n3\tC\n4\tD
> 2) Haciendo datos = '1\tA\n2\tB\n3\tC\n4\tD' en mi app, esto funciona como
> espero.
>
> ¿Dónde está mi error?
>
> Jose
>
>
> datos = '1\tA\n2\tB\n3\tC\n4\tD'
>
> print(datos.split('\n'))
>
> ['1\tA', '2\tB', '3\tC', '4\tD']
>
>
>
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar


datos = '1\tA\n2\tB\n3\tC\n4\tD'

print(datos.split('\n'))

['1\tA', '2\tB', '3\tC', '4\tD']

Creo que el problema es que no es exactamente texto, o la codificación es
distinta.

¿Podrías pasar la URL para hacer alguna prueba?

Gedece
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20180224/0f18c439/attachment.html>


Más información sobre la lista de distribución pyar