[pyar] Extracción de formantes en audio con python

Facundo Batista facundobatista en gmail.com
Jue Abr 20 19:08:02 ART 2017


2017-04-20 17:53 GMT-03:00 Matias Eduardo Bordone Carranza
<mebordone en gmail.com>:
> Buenas gente, tengo ganas de terminar un proyecto que empece en algun
> momento sobre grabaciones de voces de personas y posiciones bucales y para
> eso necesito extraer los formantes de fragmentos de audio, obvio que
> quisiera hacer esto utilizando python, preferiría hacerlo utilizando solo
> librerías estandard de python como sypy y numpy. Estuve googleando bastante
> pero no encuentro algo mas o menos sencillo.
>
> Alguien tiene experiencia en esto? Me puede tirar un centro un link un algo
> como para empezar?
>
> A esto me refiero yo con formante de audio
> https://es.wikipedia.org/wiki/Formante

Si no entiendo mal son los picos si ves las amplitudes en función de
la frecuencia.

El WAV es amplitud en función del tiempo. Si hacés FFT y sacás los
picos a mano, ¿no es lo que querés?

Para hacer FFT: https://docs.scipy.org/doc/numpy/reference/routines.fft.html

Slds.

-- 
.    Facundo

Blog: http://www.taniquetil.com.ar/plog/
PyAr: http://www.python.org/ar/
Twitter: @facundobatista


Más información sobre la lista de distribución pyar