[pyar] Sentiment Analysis

Augusto adtononi en gmail.com
Vie Ene 31 14:15:27 -03 2020


Quizás me exprese mal.

El material que necesito es una guía, libro, blog, o lo que sea que me
sirva para entender como funciona todo el proceso.

Respecto a los datasets, armaría uno propio. Tengo millones de noticias en
una base de datos, y la idea es usarlas para entrenar un modelo.

El vie., 31 ene. 2020 9:55, Juan Manuel Pérez <jmperez.85 en gmail.com>
escribió:

> Augusto:
>
>
> 1. En español hay pocos datasets (en general para casi todo) de sentiment
> analysis. Uno de ellos es el de TASS (Taller de Análisis Semántico de la
> SEPLN)
>
> Te lo podés bajar acá: http://www.sepln.org/workshops/tass/
>
> 2. Hacer un clasificador lineal (regresión logística, SVM) usando tf-idf
> es el primer paso. Probablemente en un corpus tan chiquito no puedas
> obtener una mejora notable de performance usando algo más avanzado
>
> 3. Otra opción es usar *fasttext
> <https://fasttext.cc/docs/en/crawl-vectors.html> *que te provee una forma
> fácil de clasificar texto. Si no recuerdo mal, hace una regresión logística
> combinando los embeddings de las distintas palabras.
>
> Saludos,
>
> JM
>
>
> On Fri, Jan 31, 2020 at 8:20 AM Augusto <adtononi en gmail.com> wrote:
>
>> Buen día grupo,
>>
>> Estoy queriendo realizar un sentiment Analysis en español y quería saber
>> si alguien tiene material al respecto.
>> Estuve pensando en realizar una matriz calculando el tf-idf y luego
>> calcular el porcentaje de aquellas palabras que más impacten, pero no estoy
>> seguro de que sea un buen approach. Ustedes que recomiendan?
>>
>> Saludos!
>> _______________________________________________
>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>> Sitio web: http://www.python.org.ar/
>>
>> Para administrar la lista (o desuscribirse) entrar a
>> http://listas.python.org.ar/listinfo/pyar
>>
>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>> Argentina - http://www.usla.org.ar
>
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20200131/d3b55de8/attachment.html>


Más información sobre la lista de distribución pyar