[pyar] Sentiment Analysis

Juan Manuel Pérez jmperez.85 en gmail.com
Vie Ene 31 09:55:04 -03 2020


Augusto:


1. En español hay pocos datasets (en general para casi todo) de sentiment
analysis. Uno de ellos es el de TASS (Taller de Análisis Semántico de la
SEPLN)

Te lo podés bajar acá: http://www.sepln.org/workshops/tass/

2. Hacer un clasificador lineal (regresión logística, SVM) usando tf-idf es
el primer paso. Probablemente en un corpus tan chiquito no puedas obtener
una mejora notable de performance usando algo más avanzado

3. Otra opción es usar *fasttext
<https://fasttext.cc/docs/en/crawl-vectors.html> *que te provee una forma
fácil de clasificar texto. Si no recuerdo mal, hace una regresión logística
combinando los embeddings de las distintas palabras.

Saludos,

JM


On Fri, Jan 31, 2020 at 8:20 AM Augusto <adtononi en gmail.com> wrote:

> Buen día grupo,
>
> Estoy queriendo realizar un sentiment Analysis en español y quería saber
> si alguien tiene material al respecto.
> Estuve pensando en realizar una matriz calculando el tf-idf y luego
> calcular el porcentaje de aquellas palabras que más impacten, pero no estoy
> seguro de que sea un buen approach. Ustedes que recomiendan?
>
> Saludos!
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20200131/19201b52/attachment.html>


Más información sobre la lista de distribución pyar