我正在做声音延迟测试。我的设备将收到蜂鸣信号或静音信号。我如何区分这些信号。请帮我。提前致谢..

有帮助吗?

解决方案

这取决于。如果数字音频是综合生成的(例如通过另一个函数),因此您可以依赖这样一个事实:在一种情况下,您将获得真正的数字静音(归零样本),那么解决方案就是简单地测试归零样本在测量窗口上方。除零以外的任何事物都不是沉默。

不过,我猜测您正在处理从麦克风录制的现实世界音频。如果是这种情况,那么测量时间窗口内的能量并将其与阈值进行比较确实有意义。您必须确定的两个参数是:

  1. 阈值能级
  2. 时间窗口的长度

如果阈值太低,你的误报率就会太高;非嘟嘟声的背景噪音可能会被解释为嘟嘟声。相反,如果您的阈值太高,您的系统可能会将蜂鸣声归类为噪音。幸运的是,如果您正在处理背景噪音相当低的音频,您的性能不会对此阈值非常敏感。

较长的窗口长度将降低这些误报/漏报率,从而使您的系统更加稳健,但系统可用性可能会因窗口过长而受到影响。例如,自动电话系统对按键进行分类以帮助菜单导航。如果他们要求用户一次按住每个键三秒钟,准确性会提高,但代价是几乎所有可用性。

我鼓励您不要像保罗建议的那样仅根据一个最大样本做出决定。这样做完全破坏了采样窗口长度提供的对误报的抵抗力。

其他提示

看大约为10毫秒值得采样(例如441个样本以44.1kHz)的,并测量在该缓冲器中的能量。如果它是高于某个阈值它是一个信号,并且如果它是低于阈值,则它的沉默。

要测量能量只是通过样本的数量总结在缓冲器和除法每个样本的平方值。

如果他们使用的环回方式,并降低噪点,拍出什么考虑?例如,如果他们发出蜂鸣第二设备,环回和发送回给发件人,发送一个停止工作分组,做同样的,他们不能测量在发送端级别的延迟(只要他们知道实际的网络延迟)

许可以下: CC-BY-SA归因
不隶属于 StackOverflow
scroll top