[pyar] Sentiment Analysis

Augusto adtononi en gmail.com
Lun Feb 3 13:48:01 -03 2020


Muchas gracias, veré si lo consigo!

El lun., 3 feb. 2020 13:03, Diego Carabajal <diecarabajal en gmail.com>
escribió:

> Hola Augusto,
>
> Te recomiendo el libro "Web Data Mining, de Bing Liu" que tiene un
> capítulo dedicado a análisis sentimental. Si no lo conseguis, mandame un mp
> y te lo paso.
>
> Otros que han escrito bastante al respecto son Bo Pang y Lillian Lee.
>
> Slds.
>
> Diego.
>
>
>
> El vie., 31 ene. 2020 a las 14:15, Augusto (<adtononi en gmail.com>)
> escribió:
>
>> Quizás me exprese mal.
>>
>> El material que necesito es una guía, libro, blog, o lo que sea que me
>> sirva para entender como funciona todo el proceso.
>>
>> Respecto a los datasets, armaría uno propio. Tengo millones de noticias
>> en una base de datos, y la idea es usarlas para entrenar un modelo.
>>
>> El vie., 31 ene. 2020 9:55, Juan Manuel Pérez <jmperez.85 en gmail.com>
>> escribió:
>>
>>> Augusto:
>>>
>>>
>>> 1. En español hay pocos datasets (en general para casi todo) de
>>> sentiment analysis. Uno de ellos es el de TASS (Taller de Análisis
>>> Semántico de la SEPLN)
>>>
>>> Te lo podés bajar acá: http://www.sepln.org/workshops/tass/
>>>
>>> 2. Hacer un clasificador lineal (regresión logística, SVM) usando tf-idf
>>> es el primer paso. Probablemente en un corpus tan chiquito no puedas
>>> obtener una mejora notable de performance usando algo más avanzado
>>>
>>> 3. Otra opción es usar *fasttext
>>> <https://fasttext.cc/docs/en/crawl-vectors.html> *que te provee una
>>> forma fácil de clasificar texto. Si no recuerdo mal, hace una regresión
>>> logística combinando los embeddings de las distintas palabras.
>>>
>>> Saludos,
>>>
>>> JM
>>>
>>>
>>> On Fri, Jan 31, 2020 at 8:20 AM Augusto <adtononi en gmail.com> wrote:
>>>
>>>> Buen día grupo,
>>>>
>>>> Estoy queriendo realizar un sentiment Analysis en español y quería
>>>> saber si alguien tiene material al respecto.
>>>> Estuve pensando en realizar una matriz calculando el tf-idf y luego
>>>> calcular el porcentaje de aquellas palabras que más impacten, pero no estoy
>>>> seguro de que sea un buen approach. Ustedes que recomiendan?
>>>>
>>>> Saludos!
>>>> _______________________________________________
>>>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>>>> Sitio web: http://www.python.org.ar/
>>>>
>>>> Para administrar la lista (o desuscribirse) entrar a
>>>> http://listas.python.org.ar/listinfo/pyar
>>>>
>>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>>> Argentina - http://www.usla.org.ar
>>>
>>> _______________________________________________
>>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>>> Sitio web: http://www.python.org.ar/
>>>
>>> Para administrar la lista (o desuscribirse) entrar a
>>> http://listas.python.org.ar/listinfo/pyar
>>>
>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>> Argentina - http://www.usla.org.ar
>>
>> _______________________________________________
>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>> Sitio web: http://www.python.org.ar/
>>
>> Para administrar la lista (o desuscribirse) entrar a
>> http://listas.python.org.ar/listinfo/pyar
>>
>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>> Argentina - http://www.usla.org.ar
>
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20200203/c8f3a12d/attachment.html>


Más información sobre la lista de distribución pyar