您好,歡迎您訪問(wèn)廣州亮鑫電子科技有限公司官方網(wǎng)站!
聯(lián)系人:徐經(jīng)理
手機(jī):13609715026(技術(shù)咨詢)
電話:020-39985615
Email:184049149@qq.com
Q Q :2397159370
網(wǎng)址:sdsdf.cn
地址: 廣州市番禺區(qū)洛浦街沿沙路51號(hào)東鄉(xiāng)聯(lián)發(fā)工業(yè)區(qū)A3棟2層202廣州亮鑫電子科技有限公司
回聲消除是處理前端聲學(xué)信號(hào)的重要方法。回聲消除的應(yīng)用場(chǎng)景和原理是怎么樣的?
回聲消除(AEC)介紹。
1.定義
所謂的回聲是指通過(guò)麥克風(fēng)收集設(shè)備本地?fù)P聲器播放的聲音形成的聲學(xué)信號(hào)?;芈曄侵冈诒A舯镜赜脩粽Z(yǔ)音的前提下,從麥克風(fēng)收集的信號(hào)中消除這些回聲的過(guò)程。因此,回聲消除算法解決了設(shè)備揚(yáng)聲器與其自身麥克風(fēng)之間的耦合現(xiàn)象。
2.使用場(chǎng)景。
實(shí)時(shí)音視頻通信(RTC)和智能語(yǔ)音交互中斷是目前最常見(jiàn)的兩種場(chǎng)景。
(1)RTC。
常見(jiàn)的應(yīng)用場(chǎng)景包括在線會(huì)議系統(tǒng)、手機(jī)通話、藍(lán)牙耳機(jī)通話、車(chē)載通話系統(tǒng)等。
(2)智能語(yǔ)音交互中斷。
例如在語(yǔ)音交互設(shè)備播放內(nèi)容時(shí)語(yǔ)音喚醒,或在與語(yǔ)音助手對(duì)話時(shí)用戶打斷語(yǔ)音助手。
3.意義
如果沒(méi)有回聲消除算法,在RTC場(chǎng)景中,遠(yuǎn)程演講者的聲音通過(guò)揚(yáng)聲器播放,然后通過(guò)近端的麥克風(fēng)收集并傳輸回遠(yuǎn)端,導(dǎo)致遠(yuǎn)端演講者聽(tīng)到自己的聲音,這也是回聲一詞的由來(lái)。因此,在通信過(guò)程中,回聲將大大降低信息傳輸?shù)恼_性和效率。
在智能語(yǔ)音交互場(chǎng)景中,如果回聲消除算法不好,通過(guò)設(shè)備本身的麥克風(fēng)收集交互設(shè)備對(duì)用戶的響應(yīng)語(yǔ)音,作為用戶的指令識(shí)別,導(dǎo)致操作錯(cuò)誤,甚至設(shè)備也會(huì)繼續(xù)提問(wèn)和回答。因此,回聲消除算法對(duì)于語(yǔ)音交互系統(tǒng)的體驗(yàn)非常重要。
二、回聲生成模型。
下圖顯示了回聲生成模型。系統(tǒng)接收到的信號(hào)通常稱(chēng)為遠(yuǎn)程信號(hào)x,這也是揚(yáng)聲器準(zhǔn)備播放的語(yǔ)音信號(hào)。信號(hào)首先通過(guò)系統(tǒng)路徑(主要包括一些軟件接口、軟件緩沖區(qū)、硬件緩沖區(qū)、數(shù)字模式轉(zhuǎn)換器和功率放大器等)。系統(tǒng)路徑通常只會(huì)導(dǎo)致信號(hào)延遲,而不會(huì)改變信號(hào)的特性。
然后,電信號(hào)到達(dá)揚(yáng)聲器并轉(zhuǎn)換為振動(dòng)信號(hào),通過(guò)聲音傳輸被用戶聽(tīng)到。在這個(gè)過(guò)程中,由于揚(yáng)聲器的特性,信號(hào)會(huì)發(fā)生變化。振動(dòng)信號(hào)的一部分將直接傳播到麥克風(fēng)(直接耦合),而另一部分將通過(guò)房間墻壁和物體的反射傳遞到麥克風(fēng),這就是所謂的房間聲學(xué)路徑。通過(guò)揚(yáng)聲器轉(zhuǎn)換和房間聲學(xué)路徑傳遞到麥克風(fēng)的遠(yuǎn)程信號(hào)與原始遠(yuǎn)程信號(hào)不同。在這里,信號(hào)y通常被稱(chēng)為線性回聲。麥克風(fēng)采集了信號(hào)y、干凈的聲音s和噪聲n。這種混合信號(hào)稱(chēng)為近端信號(hào),用D表示。在這種模式下,回聲消除算法的目標(biāo)是通過(guò)遠(yuǎn)程信號(hào)x和近端信號(hào)d以某種方式得到y(tǒng)的估計(jì),并將其從d中減去。遠(yuǎn)程信號(hào)x相當(dāng)于向算法提供參考,因此也稱(chēng)為參考信號(hào)。
回聲生成模型。
三、回聲消除法。
根據(jù)回聲的生成原理,回聲消除的核心是估計(jì)揚(yáng)聲器對(duì)麥克風(fēng)的聲學(xué)影響響應(yīng),使用參考信號(hào)和估計(jì)濾波器接近麥克風(fēng)接收到的回聲信號(hào),然后從混合信號(hào)中減去,保留近端語(yǔ)音信號(hào)?;芈曄惴ǖ囊话憬Y(jié)構(gòu)如下圖所示。
回聲消除算法的主要模塊由三個(gè)模塊組成:延時(shí)估計(jì)、自適應(yīng)濾波器、剩余回聲估計(jì)和消除。
其中,延遲估計(jì)模塊的作用是檢測(cè)系統(tǒng)路徑和房間聲學(xué)路徑對(duì)遠(yuǎn)端信號(hào)的延遲,及時(shí)對(duì)齊遠(yuǎn)端信號(hào)和相應(yīng)的近端信號(hào)。
自適應(yīng)濾波器模塊將揚(yáng)聲器特性和房間聲學(xué)路徑簡(jiǎn)化為線性系統(tǒng),試圖通過(guò)自適應(yīng)濾波器找到線性系統(tǒng)的傳輸函數(shù),通過(guò)系統(tǒng)將遠(yuǎn)程信號(hào)x轉(zhuǎn)換為相應(yīng)的y,然后從近端信號(hào)中減去。
在實(shí)際系統(tǒng)中,由于存在非線性劃分和自適應(yīng)濾波器本身的誤差,僅靠自適應(yīng)濾波器模塊無(wú)法消除回聲,總會(huì)有一些回聲殘留。因此,有必要估計(jì)和消除模塊,以進(jìn)一步處理剩余的回聲。該模塊通常為非線性處理。
而且在RTC場(chǎng)景中,還需要舒適的噪聲生成模塊,補(bǔ)充輕微的白噪聲,使主觀聽(tīng)覺(jué)更加舒適。
因此,回聲一般可以分為線性回聲和非線性回聲,線性回聲可以通過(guò)自適應(yīng)濾波來(lái)處理,非線性回聲可以通過(guò)殘留回聲來(lái)估計(jì)和消除。