音高(Pitch)和基频(F0)是两个非常接近的概念, 音高和基频的关系最早在音乐界被发现, 在1000Hz以下,基频翻倍略小于音高的八度音程; 在3000Hz以上,保持基频不变,音强增强能使得音高增加; 以上是来自于正弦波实验的结论,而实际上,人声的谐波结构也会影响音高感知。 目前的基频提取算法很多,但是并没有一个基频提取算法在各种条件下都工作得很好。
尽管它们有所不同,但通常并不区分。
通常认为,音高增高八度音程相当于基频翻倍。
而在1000-5000Hz范围,基频翻倍略大于音高的八度音程。
John M. Eargle. Music, Sound and Technology. Van Nostrand Reinhold, Toronto, 1995.
Stephen Handel. Listening. MIT Press, Cambridge, 1989.
在2000Hz以下,保持基频不变,音强增强却使得音高降低。
Stanley Coren, Lawrence M. Ward, and James T. Enns. Sensation and Perception.
Harcourt Brace College Publishers, Toronto, 1994.
通常一个算法离开了特定领域,性能就会变差。提取音乐基频和语音基频的算法就有所差异。
评论