[pyar] consulta parseo sencillo de .xml

Alejandro Santos listas en alejolp.com
Jue Mar 12 12:42:44 ART 2015


2015-03-12 12:46 GMT+01:00 Mariano AM <marianoamx en gmail.com>:
>
> Que recomiendan que haga con el .xml malformado? Pregunto porque tengo poca
> experiencia en ésto.
>
> Es un reporte que se genera diariamente y mi intención es dejar todo
> automatizado.
> Hice un .py que genera un .csv comma separated values que levanta las
> estadísticas que me interesan para luego generar medio a mano un gráfico en
> alguna planilla de cálculo, en excel 2010 que es lo que nos instalan en el
> laburo.
>

No me quedó claro de dónde sale el XML, lo ideal es que lo puedas
generar sin ELEMENTos repeditos que revienten con minidom. Lo bueno es
que lo que está malformado es solo el DOCTYPE, y si buscás una forma
rápida (y sucia) de limpiar el DOCTYPE roto de tu XML, lo que podés
hacer es:

import xml.etree.ElementTree as ET
from xml.dom.minidom import parseString

def limpiar_xml(S):
    e = ET.fromstring(S)
    return ET.tostring(e, encoding="utf-8")

dom = parseString(limpiar_xml(data))

y acá usás "dom" sin problemas.

-- 
Alejandro Santos


More information about the pyar mailing list