[pyar] NLP con NLTK o SpaCy

Pablo Gabriel Celayes pablocelayes en gmail.com
Jue Nov 23 19:30:20 ART 2017


Hola, ¿cómo va?

Es verdad que spaCy es bastante más rápido:
https://spacy.io/usage/facts-figures

Además para cada tarea de NLP trata de implementar la solución más *state
of the art* posible, en lugar de dar varias alternativas como NLTK.
Si es para hacer algo "real" y ponerlo en producción, es muy recomendable
spaCy. Si estás aprendiendo, por ahí NLTK es un poco más sencillo de usar.

Te puede interesar usar textacy, que está construído arriba de spaCy y
agrega varias implementaciones de tareas de más alto nivel, como extracción
de keywords, o sumarización.

También podrías probar gensim, que si bien en principio es una
librería de *topic
modelling*, lo han ido extendiendo con otras cosas como modelos word2vec
(vector embeddings) personalizados, extracción de frases, etc.

Saludos!

2017-11-23 8:19 GMT-03:00 Augusto Tononi <adtononi en gmail.com>:

> Buenas, les hago una consulta. Cual de las dos libs es más recomendable?
> Spacy es relativamente nueva, pero leí que es más rápida en el
> procesamiento. Y por el otro lado, NLTK ya tiene ganado el primer puesto.
> Alguien trabajó con ambas y tiene alguna preferencia?
> La idea es iniciarme en NLP, estuve viendo un poco de NLTK pero no me
> convenció mucho y después leí acerca de Spacy.
>
> Saludos!
>
> _______________________________________________
> Lista de Correo de PyAr - Python Argentina - pyar en python.org.ar
> Sitio web: http://www.python.org.ar/
>
> Para administrar la lista (o desuscribirse) entrar a
> http://listas.python.org.ar/listinfo/pyar
>
> La lista de PyAr esta Hosteada en USLA - Usuarios de Software Libre de
> Argentina - http://www.usla.org.ar
>



-- 

*ıl**l**ıl**l**ı* ρąβℓ๏ *ıllı**lı*
https://www.linkedin.com/in/pablogabrielcelayes
<http://ar.linkedin.com/pub/pablo-celayes/5/535/911/es>
------------ próxima parte ------------
Se ha borrado un adjunto en formato HTML...
URL: <http://listas.python.org.ar/pipermail/pyar/attachments/20171123/1fbd2338/attachment.html>


Más información sobre la lista de distribución pyar