[pyar] Sentiment Analysis
Diego Carabajal
diecarabajal en gmail.com
Lun Feb 3 13:02:48 -03 2020
Hola Augusto,
Te recomiendo el libro "Web Data Mining, de Bing Liu" que tiene un capítulo
dedicado a análisis sentimental. Si no lo conseguis, mandame un mp y te lo
paso.
Otros que han escrito bastante al respecto son Bo Pang y Lillian Lee.
Slds.
Diego.
El vie., 31 ene. 2020 a las 14:15, Augusto (<adtononi en gmail.com>) escribió:
> Quizás me exprese mal.
>
> El material que necesito es una guía, libro, blog, o lo que sea que me
> sirva para entender como funciona todo el proceso.
>
> Respecto a los datasets, armaría uno propio. Tengo millones de noticias en
> una base de datos, y la idea es usarlas para entrenar un modelo.
>
> El vie., 31 ene. 2020 9:55, Juan Manuel Pérez <jmperez.85 en gmail.com>
> escribió:
>
>> Augusto:
>>
>>
>> 1. En español hay pocos datasets (en general para casi todo) de sentiment
>> analysis. Uno de ellos es el de TASS (Taller de Análisis Semántico de la
>> SEPLN)
>>
>> Te lo podés bajar acá: http://www.sepln.org/workshops/tass/
>>
>> 2. Hacer un clasificador lineal (regresión logística, SVM) usando tf-idf
>> es el primer paso. Probablemente en un corpus tan chiquito no puedas
>> obtener una mejora notable de performance usando algo más avanzado
>>
>> 3. Otra opción es usar *fasttext
>> <https://fasttext.cc/docs/en/crawl-vectors.html> *que te provee una
>> forma fácil de clasificar texto. Si no recuerdo mal, hace una regresión
>> logística combinando los embeddings de las distintas palabras.
>>
>> Saludos,
>>
>> JM
>>
>>
>> On Fri, Jan 31, 2020 at 8:20 AM Augusto <adtononi en gmail.com> wrote:
>>
>>> Buen día grupo,
>>>
>>> Estoy queriendo realizar un sentiment Analysis en español y quería saber
>>> si alguien tiene material al respecto.
>>> Estuve pensando en realizar una matriz calculando el tf-idf y luego
>>> calcular el porcentaje de aquellas palabras que más impacten, pero no estoy
>>> seguro de que sea un buen approach. Ustedes que recomiendan?
>>>
>>> Saludos!
>>> _______________________________________________
>>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>>> Sitio web: http://www.python.org.ar/
>>>
>>> Para administrar la lista (o desuscribirse) entrar a
>>> http://listas.python.org.ar/listinfo/pyar
>>>
>>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>>> Argentina - http://www.usla.org.ar
>>
>> _______________________________________________
>> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
>> Sitio web: http://www.python.org.ar/
>>
>> Para administrar la lista (o desuscribirse) entrar a
>> http://listas.python.org.ar/listinfo/pyar
>>
>> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
>> Argentina - http://www.usla.org.ar
>
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20200203/9ad43c34/attachment.html>
Más información sobre la lista de distribución pyar