[pyar] Diccionario de Lexicon para maquinas de aprendizajes en Español

Julian Agustin Cardonnet jcardonnet en gmail.com
Dom Sep 11 18:52:41 ART 2016


Hola Lucho,
Si el problema que estas queriendo resolver es "dado un texto
asignarlo automaticamente a una unica categoria", una forma simple de
hacerlo es usando un clasificador basado en aprendizaje supervisado. La
idea es entrenar el clasificador dandole ejemplos de textos categorizados
manualmente y en base a eso el algoritmo aprende como clasificar nuevos
textos.

Por lo que contas de lo que necesitas hacer, creo que hacerlo basado en
lexicons va a requerir mucho trabajo y la precisión de las clasificaciones
no va a ser tan buena en comparación a otras técnicas (una SVM por ej)

Otras cosas importantes para elegir el algoritmo son los requerimientos de
performance que tengas y la naturaleza de los textos a procesar (longitud,
cantidad, caracteristicas de la gramatica, etc) asi que cuantos mas datos
puedas darnos sobre eso, mejor te vamos a poder orientar.

Saludos,
Julian



El 11 de septiembre de 2016, 12:23, Lucho Martingaste <
martingasteluciano en gmail.com> escribió:

> Buenos días Comunidad, buen domingo.
> Quería consultar  sobre diccionarios para maquinas de aprendizaje, es que
> estoy trabajando en un proyecto de análisis automático de texto y necesito
> saber de que forma puedo hacer para identificar las palabras claves que
> analice de cada texto.
> Para ello el análisis morfológico y etiquetado del texto lo trabajo con
> FreeLing, pero necesito saber como comparar contra un diccionario esas
> palabras claves.
> Mi trabajo es analizar las quejas de ciudadanos, y a partir del análisis
> realizado derivar esa queja al sector que corresponda atender.
> Muchas gracias por su ayuda desde ya .
> Saludos!
>
> _______________________________________________
> pyar mailing list pyar en python.org.ar
> http://listas.python.org.ar/listinfo/pyar
>
> PyAr - Python Argentina - Sitio web: http://www.python.org.ar/
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20160911/4d4aa864/attachment.html>


Más información sobre la lista de distribución pyar