免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)聯(lián)系小編進(jìn)行處理。
MEMS麥克風(fēng)在語(yǔ)音激活設(shè)計(jì)中如何輔助聲音檢測(cè)和關(guān)鍵詞識(shí)別
發(fā)布時(shí)間:2020-06-11 責(zé)任編輯:lina
【導(dǎo)讀】隨著用戶越來(lái)越依賴語(yǔ)音作為用戶界面,設(shè)計(jì)人員面臨著多重挑戰(zhàn),既要以盡可能小的功耗和響應(yīng)時(shí)間來(lái)實(shí)現(xiàn)最準(zhǔn)確、最可靠的用戶語(yǔ)音界面 (VUI),又要滿足更緊湊的空間、更低的成本預(yù)算并縮短設(shè)計(jì)進(jìn)度的要求。
隨著用戶越來(lái)越依賴語(yǔ)音作為用戶界面,設(shè)計(jì)人員面臨著多重挑戰(zhàn),既要以盡可能小的功耗和響應(yīng)時(shí)間來(lái)實(shí)現(xiàn)最準(zhǔn)確、最可靠的用戶語(yǔ)音界面 (VUI),又要滿足更緊湊的空間、更低的成本預(yù)算并縮短設(shè)計(jì)進(jìn)度的要求。為了幫助設(shè)計(jì)人員達(dá)到這些目標(biāo),多家供應(yīng)商推出了一種先進(jìn)的微機(jī)電系統(tǒng) (MEMS) 麥克風(fēng),這種麥克風(fēng)具有多個(gè)性能特征,有助于實(shí)現(xiàn)強(qiáng)大的喚醒詞檢測(cè)和 VUI 語(yǔ)音指令處理。
MEMS 麥克風(fēng)(也稱為硅麥克風(fēng))已普遍在智能手機(jī)、智能手表、無(wú)線耳塞、汽車、智能電視以及遙控器中使用。這在很大程度上歸功于大獲成功的個(gè)人語(yǔ)音助手(例如亞馬遜的 Alexa、谷歌語(yǔ)音助手和蘋(píng)果的 Siri)。這些助手會(huì)收聽(tīng)特定的語(yǔ)音指令,使用喚醒詞識(shí)別算法從周圍環(huán)境中提取語(yǔ)音指令。設(shè)計(jì)人員的訣竅是:以經(jīng)濟(jì)高效地的方式快速實(shí)現(xiàn)這種提取功能,同時(shí)盡管存在環(huán)境噪聲,也要提高可靠性、準(zhǔn)確性和遠(yuǎn)場(chǎng)語(yǔ)音采集能力。
本文將討論影響 VUI 設(shè)計(jì)的 MEMS 麥克風(fēng)的關(guān)鍵特性,包括信噪比 (SNR)、動(dòng)態(tài)范圍、靈敏度和啟動(dòng)時(shí)間。然后介紹來(lái)自 TDK InvenSense、CUI Devices、STMicroelectronics 和 Vesper Technologies 的硬件和軟件解決方案,并展示如何將其應(yīng)用于語(yǔ)音激活設(shè)計(jì)中。
MEMS 麥克風(fēng)如何工作
一個(gè) MEMS 麥克風(fēng)封裝中通常包含兩個(gè)組件:將聲波轉(zhuǎn)換為電信號(hào)的 MEMS 膜,以及用作阻抗轉(zhuǎn)換器向音頻信號(hào)鏈提供可用模擬輸出的放大器。如果需要數(shù)字輸出,還可在其芯片上再集成一個(gè)組件——模數(shù)轉(zhuǎn)換器 (ADC)。
圖 1:MEMS 麥克風(fēng)的基本結(jié)構(gòu)顯示了其兩個(gè)關(guān)鍵構(gòu)建塊:MEMS 變動(dòng)器和信號(hào)處理鏈(位于 ASIC 中)。(圖片來(lái)源:CUI Devices)
除了支持具有模擬或數(shù)字輸出的微型麥克風(fēng)外,MEMS 技術(shù)還實(shí)現(xiàn)了出色的相位匹配和漂移性能。
MEMS 麥克風(fēng)的關(guān)鍵特性
對(duì)于語(yǔ)音控制設(shè)備設(shè)計(jì)人員而言,需要在 MEMS 麥克風(fēng)中查找的關(guān)鍵參數(shù)如下:
• 信噪比 (SNR):這是參考信號(hào)電平與麥克風(fēng)輸出信號(hào)的噪聲電平之比。SNR 測(cè)量值包括麥克風(fēng)元件和 MEMS 麥克風(fēng)封裝中集成的任何其他設(shè)備(例如 IC)產(chǎn)生的噪聲。
靈敏度:響應(yīng) 1千赫 (kHz) 正弦波時(shí)的模擬或數(shù)字輸出值,其聲壓級(jí) (SPL) 為 94 分貝 (dB) 或1 帕斯卡 (Pa),后者為壓力測(cè)量值。
• 靈敏度公差:任何給定的單只麥克風(fēng)的靈敏度范圍。嚴(yán)格的靈敏度公差可在使用多個(gè)麥克風(fēng)時(shí)確保一致性。
• 動(dòng)態(tài)范圍:麥克風(fēng)線性響應(yīng)的最大和最小聲壓級(jí)的差異測(cè)量。
• 頻率響應(yīng):麥克風(fēng)能夠工作的頻率范圍。
• 啟動(dòng)時(shí)間:響應(yīng)觸發(fā)事件時(shí)麥克風(fēng)被喚醒并輸出有效信號(hào)的速度。
諸如遙控器、電視和智能揚(yáng)聲器之類的語(yǔ)音控制設(shè)備通常工作在高環(huán)境噪聲下。同樣,在遠(yuǎn)場(chǎng)操作中,用戶可能在附近或距離 1 至 10 米 (m) 的地方。這些情況使麥克風(fēng)的動(dòng)態(tài)范圍、靈敏度和 SNR 變得如此重要。在陣列中使用多個(gè)麥克風(fēng)的應(yīng)用中,靈敏度公差至關(guān)重要。
雖然可以規(guī)定每個(gè)麥克風(fēng)具有一定的靈敏度水平,但細(xì)微的結(jié)構(gòu)變化可能會(huì)導(dǎo)致各種變更。但是,由于 MEMS 麥克風(fēng)是使用嚴(yán)格控制的半導(dǎo)體制造工藝開(kāi)發(fā),因此具有匹配嚴(yán)格的靈敏度公差,這是任何麥克風(fēng)陣列進(jìn)行有效數(shù)據(jù)處理所需的(圖 2)。
圖 2:陣列中使用的麥克風(fēng)必須嚴(yán)格匹配才能實(shí)現(xiàn)所需的信號(hào)處理性能。(圖片來(lái)源:CUI Devices)
為使支持 VUI 的設(shè)計(jì)能越來(lái)越多地采用麥克風(fēng)陣列,緊公差的輔助作用極其重要。在麥克風(fēng)陣列中,由兩個(gè)或多個(gè)麥克風(fēng)收集信號(hào),然后在組合信號(hào)并形成合成信號(hào)之前,分別處理來(lái)自每個(gè)麥克風(fēng)的信號(hào)(放大、延遲或?yàn)V波)。在麥克風(fēng)陣列中,可以使用多個(gè)輸入來(lái)確定方向響應(yīng)(也稱為波束形成),以濾除不需要的噪聲;與此同時(shí),重點(diǎn)關(guān)注在來(lái)自更期望的方向上的聲音。
MEMS 麥克風(fēng)的啟動(dòng)時(shí)間對(duì)于捕獲全部關(guān)鍵詞并確保其準(zhǔn)確性也至關(guān)重要。為了節(jié)電,支持 VUI 的設(shè)備保持低功耗狀態(tài);但是,如果麥克風(fēng)響應(yīng)喚醒觸發(fā)的啟動(dòng)時(shí)間短,則會(huì)影響 VUI 喚醒時(shí)間,進(jìn)而影響喚醒詞檢測(cè)性能以及功耗。
只要在選擇麥克風(fēng)時(shí)考慮到這些特性,那么在具有高環(huán)境噪聲或者用戶遠(yuǎn)距離講話,或者這兩種情形都存在的情況下,后續(xù)的語(yǔ)音處理算法便能夠更好地執(zhí)行用戶語(yǔ)音提取功能。
模擬與數(shù)字 MEMS 麥克風(fēng)接口
正如有關(guān) MEMS 麥克風(fēng)工作原理的部分所述,MEMS 麥克風(fēng)輸出可以采用模擬或者數(shù)字形式。模擬 MEMS 麥克風(fēng)使用內(nèi)部放大器將麥克風(fēng)的輸出信號(hào)驅(qū)動(dòng)至具有低輸出阻抗的合理高電平。這提供了一個(gè)連接音頻處理器的直接接口。對(duì)于 VUI,設(shè)計(jì)人員需要確保相關(guān)處理器具有板載 ADC,或者設(shè)計(jì)人員能夠選擇 ADC 以滿足其特定要求。后者會(huì)增加復(fù)雜性和成本。
借助數(shù)字 MEMS 麥克風(fēng),麥克風(fēng)輸出可直接應(yīng)用于通常的微控制器或數(shù)字信號(hào)處理器 (DSP) 的數(shù)字電路。用于電噪聲環(huán)境的 VUI 設(shè)計(jì)更傾向于數(shù)字麥克風(fēng),因?yàn)榕c模擬輸出信號(hào)相比,數(shù)字輸出信號(hào)具有更高的抗噪能力。
此外,數(shù)字 MEMS 麥克風(fēng)通常采用脈沖密度調(diào)制 (PDM) 將模擬信號(hào)電壓轉(zhuǎn)換為包含相應(yīng)密度的邏輯高信號(hào)的單比特?cái)?shù)字流。這樣可以進(jìn)一步抵御射頻干擾 (RFI) 和電磁干擾 (EMI)。這對(duì)于大型麥克風(fēng)陣列和諸如支持語(yǔ)音的車輛信息娛樂(lè)系統(tǒng)之類的實(shí)際大型系統(tǒng)尤其重要。
關(guān)于靈敏度,就模擬麥克風(fēng)而言,是采用以分貝為單位的聲壓級(jí)相對(duì)于 1 伏 (dB/V) 進(jìn)行測(cè)量的。對(duì)于數(shù)字麥克風(fēng),通常以相對(duì)于滿刻度分貝值為單位進(jìn)行測(cè)量 (dB FS) 。
VUI 的 MEMS 麥克風(fēng)解決方案
TDK InvenSense 的 ICS-40740 模擬 MEMS 麥克風(fēng)滿足了 VUI 應(yīng)用的許多關(guān)鍵麥克風(fēng)性能要求。該器件包含一個(gè) MEMS 麥克風(fēng)元件、一個(gè)阻抗轉(zhuǎn)換器和一個(gè)差分輸出放大器,采用小型 4.00 x 3.00 x 1.20 毫米 (mm) 的表面貼裝封裝。該器件采用 1.5 伏電源供電,工作時(shí)僅消耗 165 微安 (µA) 電流(圖 3)。
圖 3:ICS-40740 模擬 MEMS 麥克風(fēng)滿足智能揚(yáng)聲器和可穿戴設(shè)備(例如降噪耳機(jī))的尺寸和功率預(yù)算要求。(圖片來(lái)源: TDK InvenSense)
該器件的 SNR 為 70 dBA(A 加權(quán)分貝),并與 108.5 dB 的寬動(dòng)態(tài)范圍相耦合,即使在高環(huán)境噪聲和遠(yuǎn)場(chǎng)條件下也能檢測(cè)到語(yǔ)音信號(hào)。此外,該器件具有 80 赫茲 (Hz) 到 20 kHz 的寬工作頻率響應(yīng)范圍,132.5 dB 的線性響應(yīng)性能和 ±1 dB 靈敏度公差。后者使其對(duì)于麥克風(fēng)陣列非常有用。
ICS-40740 的封裝小、功耗低,使其適用于圍繞智能揚(yáng)聲器和諸如降噪耳機(jī)等可穿戴設(shè)備構(gòu)建的物聯(lián)網(wǎng) (IoT) 應(yīng)用程序。
Vesper Technologies 的 VM3000 是一款全向、底部端口壓電式數(shù)字 MEMS 麥克風(fēng),具有不到 200 微秒 (µs) 的超快速啟動(dòng)時(shí)間,使其被快速喚醒,足以捕獲完整的喚醒詞(圖4)。
圖4:VM3000 壓電式數(shù)字 MEMS 麥克風(fēng)具有不到 200 µs 的超快速啟動(dòng)時(shí)間,使其能夠足被快速喚醒,足以捕獲完整的喚醒詞。(圖片來(lái)源:Vesper Technologies)
在壓電式 MEMS 麥克風(fēng)中,當(dāng)聲波撞擊壓電懸臂時(shí),將使懸臂移動(dòng)并產(chǎn)生電壓。該電壓由一個(gè)功耗非常低的比較器電路檢測(cè),該電路會(huì)將喚醒信號(hào)發(fā)送到音頻系統(tǒng)。
由于壓電式 MEMS 麥克風(fēng)不需要偏置電壓,因此 VM3000 在被喚醒詞指令啟動(dòng)前幾乎無(wú)功耗。而且,這種麥克風(fēng)僅需 0.35 µA 電流即可保持休眠模式,并且能夠在不到 100 µs 的時(shí)間內(nèi)切換到性能模式。超低功耗休眠模式與快速模式切換相結(jié)合,還能確保在喚醒音頻設(shè)備時(shí)不會(huì)丟失任何信息。
VM3000 數(shù)字麥克風(fēng)幾乎可以與任何音頻芯片配對(duì),其輸出特點(diǎn)是在一條數(shù)據(jù)線上復(fù)用兩個(gè)麥克風(fēng)。該麥克風(fēng)在 1 kHz 信號(hào)下的典型 SNR 為 63 dB,具有 122 dB SPL 聲學(xué)過(guò)載點(diǎn) (AOP)。
VM3000 采用 3.5 x 2.65 x 1.3 mm 封裝,并通過(guò)集成 ADC 節(jié)省物料清單 (BOM)。此外,VM3000 使用單層壓電晶體,使其不受靈敏度漂移的影響,并可防止灰塵、水、濕氣和其他環(huán)境顆粒的侵害。
諸如 VM3000 之類的壓電式 MEMS 麥克風(fēng)無(wú)需使用保護(hù)網(wǎng)或薄膜覆蓋多個(gè)麥克風(fēng),從而簡(jiǎn)化了陣列的音頻設(shè)計(jì)。如保護(hù)網(wǎng)或保護(hù)膜等為防止受環(huán)境污染而覆蓋聲學(xué)孔的保護(hù)元件,可導(dǎo)致 MEMS 麥克風(fēng)靈敏度下降。
VM3000 也相對(duì)容易實(shí)現(xiàn),因?yàn)樗梢灾迸c CODEC 或其他處理器連接(圖 5)。主系統(tǒng)(CODEC 等)提供主時(shí)鐘 CLK,該時(shí)鐘定義了 DATA 線上的比特速率。
圖5:VM3000 可以直接與外部處理器連接,并且可將兩個(gè)麥克風(fēng)連接到一條 DATA 線上。(圖片來(lái)源:Vesper Technologies)
有趣的是,兩個(gè)麥克風(fēng)可以通過(guò)一條 DATA 線連接。這是因?yàn)閿?shù)據(jù)是在由 L/R Select 引腳定義的時(shí)鐘 (CLK) 上升沿或下降沿設(shè)置的,而 L/R Select = GND(頂部)在時(shí)鐘下降沿設(shè)置數(shù)據(jù),L/R Select = VDD(底部)在時(shí)鐘上升沿設(shè)置數(shù)據(jù)。然后,CODEC 或處理器可以根據(jù)比特流與 CLK 邊沿的對(duì)齊方式將其分離。
入門(mén):MEMS 麥克風(fēng)評(píng)估套件
為了評(píng)估關(guān)鍵參數(shù)并簡(jiǎn)化使用 MEMS 麥克風(fēng)的音頻系統(tǒng)的設(shè)計(jì),供應(yīng)商提供了參考板和軟件開(kāi)發(fā)套件。例如,Vesper 提供了 S-VM3000-C 評(píng)估板,其中包括一個(gè) VM3000 數(shù)字 MEMS 麥克風(fēng)和一個(gè) 0.1 微法拉 (µF) 的電源旁路電容器以及一個(gè)邊緣連接器。
同樣,TDK InvenSense 為其 ICS-40740 模擬 MEMS 傳感器提供 EV_ICS-40740-FX 評(píng)估板,可讓設(shè)計(jì)人員快速、高效地分析差分模擬輸出麥克風(fēng)的性能。除 MEMS 麥克風(fēng)外,該開(kāi)發(fā)套件唯一的其他組件便是 0.1 µF 電源旁路電容器。
CUI Devices 同時(shí)提供模擬和數(shù)字 MEMS 麥克風(fēng),其 DEVKIT-MEMS-001 開(kāi)發(fā)套件用于原型開(kāi)發(fā)和測(cè)試(圖 6)。該評(píng)估板有四個(gè)獨(dú)立的麥克風(fēng)評(píng)估電路。
圖 6:DEVKIT-MEMS-001 有四個(gè)可拆卸麥克風(fēng)評(píng)估電路:其中兩個(gè)用于模擬輸出,另兩個(gè)用于數(shù)字輸出。(圖片來(lái)源:CUI Devices)
該評(píng)估板上有兩個(gè)模擬 MEMS 麥克風(fēng):底部音孔 CMM-2718AB-38308-TR 和頂部音孔 CMM-2718AT-42308-TR;兩個(gè)數(shù)字 MEMS 麥克風(fēng):底部音孔 CMM-4030DB-26354-TR 和頂部音孔 CMM-4030DT-26354-TR。頂部和底部音孔用于模擬和數(shù)字輸出麥克風(fēng),以提高設(shè)計(jì)靈活性。
比較這兩個(gè)模擬設(shè)備,CMM-2718AB-38308-TR 的靈敏度為 -38 dB,SNR 為 65 dBA。CM-2718AT-43208-TR 的靈敏度為 -42 dB,SNR 為 60 dBA。兩者的頻率范圍均為 100 Hz 至 10 kHz,并從 2 V 電源軌汲取 80 µA 電流。
對(duì)于兩個(gè)數(shù)字麥克風(fēng),CMM-4030DB-26354-TR 的靈敏度為 -26 dB FS,SNR 為 64 dBA。CMM-4030DT-26354-TR 的靈敏度為 -26 dB FS,SNR 為 65 dBA。兩者均使用 1 位 PDM 數(shù)據(jù)格式,在 100 Hz 至 10 kHz 頻率范圍內(nèi)工作,并從 2 V 電源汲取 0.54 毫安 (mA) 電流。
總結(jié)
通過(guò)仔細(xì)研究 MEMS 麥克風(fēng)(模擬和數(shù)字),可以發(fā)現(xiàn)其系統(tǒng)級(jí)性能優(yōu)勢(shì),以及它們?nèi)绾螌?duì)始終開(kāi)啟的語(yǔ)音接口設(shè)計(jì)進(jìn)行補(bǔ)充。最新的 MEMS 麥克風(fēng)采用新穎的技術(shù)來(lái)延長(zhǎng)電池壽命,改善遠(yuǎn)場(chǎng)音頻質(zhì)量并能抵御環(huán)境污染。提高關(guān)鍵詞的準(zhǔn)確性是另一個(gè)主要的設(shè)計(jì)考慮因素,它與 SNR、靈敏度容差和啟動(dòng)時(shí)間等參數(shù)密切相關(guān)。所有這些都已在最新設(shè)備中得到解決,能更好地適應(yīng) VUI 設(shè)計(jì)。
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問(wèn)題,請(qǐng)聯(lián)系小編進(jìn)行處理。
特別推薦
- AMTS 2025展位預(yù)訂正式開(kāi)啟——體驗(yàn)科技驅(qū)動(dòng)的未來(lái)汽車世界,共迎AMTS 20周年!
- 貿(mào)澤電子攜手安森美和Würth Elektronik推出新一代太陽(yáng)能和儲(chǔ)能解決方案
- 功率器件熱設(shè)計(jì)基礎(chǔ)(六)——瞬態(tài)熱測(cè)量
- 貿(mào)澤開(kāi)售Nordic Semiconductor nRF9151-DK開(kāi)發(fā)套件
- TDK推出用于可穿戴設(shè)備的薄膜功率電感器
- 日清紡微電子GNSS兩款新的射頻低噪聲放大器 (LNA) 進(jìn)入量產(chǎn)
- 中微半導(dǎo)推出高性價(jià)比觸控 MCU-CMS79FT72xB系列
技術(shù)文章更多>>
- 意法半導(dǎo)體推出首款超低功耗生物傳感器,成為眾多新型應(yīng)用的核心所在
- 是否存在有關(guān) PCB 走線電感的經(jīng)驗(yàn)法則?
- 智能電池傳感器的兩大關(guān)鍵部件: 車規(guī)級(jí)分流器以及匹配的評(píng)估板
- 功率器件熱設(shè)計(jì)基礎(chǔ)(八)——利用瞬態(tài)熱阻計(jì)算二極管浪涌電流
- AHTE 2025展位預(yù)訂正式開(kāi)啟——促進(jìn)新技術(shù)新理念應(yīng)用,共探多行業(yè)柔性解決方案
技術(shù)白皮書(shū)下載更多>>
- 車規(guī)與基于V2X的車輛協(xié)同主動(dòng)避撞技術(shù)展望
- 數(shù)字隔離助力新能源汽車安全隔離的新挑戰(zhàn)
- 汽車模塊拋負(fù)載的解決方案
- 車用連接器的安全創(chuàng)新應(yīng)用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall
熱門(mén)搜索
單向可控硅
刀開(kāi)關(guān)
等離子顯示屏
低頻電感
低通濾波器
低音炮電路
滌綸電容
點(diǎn)膠設(shè)備
電池
電池管理系統(tǒng)
電磁蜂鳴器
電磁兼容
電磁爐危害
電動(dòng)車
電動(dòng)工具
電動(dòng)汽車
電感
電工電路
電機(jī)控制
電解電容
電纜連接器
電力電子
電力繼電器
電力線通信
電流保險(xiǎn)絲
電流表
電流傳感器
電流互感器
電路保護(hù)
電路圖