嘿!您似乎在 United States,您想使用我们的 English 网站吗?
Switch to English site
Skip to main content

利用机器视觉实现机器人导航已是非常普遍,国内外学者对此也是做了大量的研究工作。然而由于机器视觉本身存在的问题,使得利用机器视觉进行机器人导航在一些情况下表现差强人意,比如,在光线不足的情况下,或者是在机器人的“视野”所不能到达的地方,机器人就找不到目标在空间中的位置,如果给机器人安装上“耳朵”,给予机器人声源采集装置,在进行人机交互的时候,人就可以通过语音告诉机器人自己现在所处的位置,机器人对声源信号进行处理, 求解出声源的具体位置,然后制定关节运动决策,使交互对象重新进入其视野之内。

声源定位技术的应用

军用:美军的狙击手探测技术

战争中,敌方狙击手通常给进攻方带来了很大的伤亡,美国已经开发出了主要采用声测、红外和激光等原理探测敌方狙击手的技术,以及时的发现并消灭敌方狙击手保障军队的行动安全。在伊拉克战争中,当伊拉克反美武装的狙击手开完枪,准备转移时,就被狙击手声源定位仪发现并击毙。

民用:远程视频会议及远程教学等

远程视频会议系统是一种让出于不同地点的人们通过某种传输介质实现“实时、可视、交互”的多媒体通讯技术。它可以通过现有的各种电气通讯传输媒体,将人物的静态和动态图像、语音、文字、图片等多种信息分送到各个用户的终端设备上,使得在地理上分散的用户可以共聚一处,通过图形、声音等多种方式交流信息,增加双方对内容的理解能力,使人们犹如身临其境参加在同一会场中的会议一样。当与会代表发言时,摄像头会检测到发声对象,并把摄像头聚焦在该人身上。

机器人领域的应用

2004年,IEEE/RSJ关于智能机器人系统的国际会议首次将机器人听觉作为一个研究主题,并从声源定位、声源分离、语音识别等角度进行讨论。

声源定位原理

根据不同应用要求,有以下三种定位原理。

仿人双耳声源定位

人耳听觉系统能够同时定位和分离多个声源,这种特性经常被称作“鸡尾酒会效应”。用计算机模仿人类听觉生理和心理机制建立听觉模型的研究范畴称为计算听觉场景分析

2006年Roman N 和 Wang D L提出双耳听觉定位跟踪多运动声源系统。在系统中采用了一种新的跟踪算法。算法联合所有可靠频道间的概率以便在目标空间中产生似然函数。似然函数描述了在一个特定的时间序列内的机动声源的方位角。最后利用隐马尔可夫模型来形成连续地跟踪和自动地探测机动声源的数量。概括为四个阶段:

基于时间差(TDOA)的声源定位

大多数声源定位是基于到达时间差的方法,该方法概括为两步:

声波以一定速度在空气中传播,到达设置于不同位置的传声器的相位不同,根据这些传声器对同一声音录制的相位差别,可以求得同一声音到每对传声器的时间差值。得到该时间差后,可以确定这个声源就处于以这对传声器所处的位置为焦点,到达时间差所对应的声音传输距离为参数的双曲面上。使用多对传声器得到多个双曲面,声源位置就处于这些双曲面的相交点。

基于声压幅度比的定位方法

这种方法利用不同传声器接收到的来自同一声源的声音信号的声压幅度差异实现声源定位。该方法的使用相对第二种要少。

总结

本文简述了声源定位的应用及实现原理。在此只做简单的描述,未做深入分析。有很多电子爱好者也在移动小车上做了声源定位的实践应用,声源定位是一个非常有趣的研究内容,如果你有兴趣可以亲自实践一番。

DesignSpark Electrical Logolinkedin