Generelle spørsmål om Speech Processing

J

jpolihro

Guest
Kjære alle,

Jeg er en nybegynner å tale analyse og trodde noen kunne hjelpe:

Det er en vibrerende kilden som vibrerer med frekvens f = f (t), f (t) er en ukjent funksjon.Som et eksempel, produserer vibrerende kilden en lyd som ligner uttrykket "LLEEEEE".
Jeg trenger å trekke datapunkter for f (t) fra dette og andre tale-lignende lyder.

Jeg er ikke sikker på hvor du skal begynne.Ovennevnte setning kan være uttalt med høy eller lav tonehøyde (stemme).Derfor er det eneste som ikke endrer seg er uttrykket selv (i eksempelet ovenfor, "LEEEE").
Whould noen har en idé om hvor jeg burde se?Setter pris på hjelp.

 
Hei,

Dersom min forståelse av saken er riktig, alt du trenger er estimering av
pitch (fundemental frekvens) på ulike tidspunkter.

Du kunne bare skrive "pitch estimering av stemmen til tale" på google og finne
masse litteratur.To enkle metoder er autokorrelasjon metode og
AMDF metoden.

 
getrajeshin,

Takk for ditt svar.Etter at jeg postet meldingen, gjorde jeg noe å lese

http://speech.bme.ogi.edu/tutordemos/SpectrogramReading/spectrogram_reading.html

og

http://www.ling.lu.se/research/speechtutorial/tutorial.html

Dette kan tyde på det du sa.Jeg vil definitivt se nærmere på det.

 

Welcome to EDABoard.com

Sponsor

Back
Top