我想要做的是具有其中它被赋予与频率强度值吐出(从0到1的浮动)的特定频率范围的成阵列的声音文件的每200毫秒分析的子程序这是我后来保存。然后,该值接着被用作这是为了“选通”与音频文件的图形的不透明度值。

问题是,我从来没有涉足音频分析前,不知道从哪里开始。我已经看过pymedia和SciPy的/ numpy的思考,我将能够在为了实现这个使用FFT,但我真的不知道我会如何处理这些数据与预期的结果结束了。在SpectrAnalyzer类pymedia的文档几乎是不存在的,并在网站上的例子实际上不与库最新发布的工作 - 这不正是让我的生活更轻松。

我将如何去开始这个项目?我是在一个完整的无所适从,我应该甚至可以使用哪些库。

有帮助吗?

解决方案

您首先需要了解如何取样工作,那么你应该使用SciPy的FFT例程(他们是相当快),以吐出频率强度值,那么你可以使用Matplotlib来绘制这样的图形。 请参见这里的一篇关于用Python分析声音文件和这里约为FFT和Spectograms Python中的类似的问题。

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top