能夠保證近場(chǎng)環(huán)境下的語(yǔ)音識(shí)別率,而且成本要低很多。至于單麥語(yǔ)音識(shí)別的效果,可以體驗(yàn)下采用單麥識(shí)別算法的360兒童機(jī)器人。但是若想更好地去除部分噪聲,可以選用2麥方案,但是這種方案比較折衷,主要優(yōu)點(diǎn)就是ID設(shè)計(jì)簡(jiǎn)單,在通話模式(也就是給人聽)情況下可以去除某個(gè)范圍內(nèi)的噪音。但是語(yǔ)音識(shí)別(也就是給機(jī)器聽)的效果和單麥的效果卻沒有實(shí)質(zhì)區(qū)別,成本相對(duì)也比較高,若再考慮語(yǔ)音交互終端必要的回聲抵消功能,成本還要上升不少。2麥方案大的弊端還是聲源定位的能力太差,因此大多是用在手機(jī)和耳機(jī)等設(shè)備上實(shí)現(xiàn)通話降噪的效果。這種降噪效果可以采用一個(gè)指向性麥克風(fēng)(比如會(huì)議話筒)來(lái)模擬,這實(shí)際上就是2麥的Endfire結(jié)構(gòu),也就是1個(gè)麥克風(fēng)通過(guò)原理設(shè)計(jì)模擬了2個(gè)麥克風(fēng)的功能。指向性麥克風(fēng)的不方便之處就是ID設(shè)計(jì)需要前后兩個(gè)開孔,這很麻煩,例如叮咚1代音箱采用的就是這種指向性麥克風(fēng)方案,因此采用了周邊一圈的懸空設(shè)計(jì)。若希望產(chǎn)品能適應(yīng)更多用戶場(chǎng)景,則可以類似亞馬遜Echo一樣直接選用4麥以上的麥克風(fēng)陣列。這里簡(jiǎn)單給個(gè)參考,機(jī)器人一般4個(gè)麥克風(fēng)就夠了,音箱建議還是選用6個(gè)以上麥克風(fēng),至于汽車領(lǐng)域,好是選用其他結(jié)構(gòu)形式的麥克風(fēng)陣列。涉及一種便攜式可視化麥克風(fēng)陣列裝置。上海電子類麥克風(fēng)陣列服務(wù)標(biāo)準(zhǔn)
本實(shí)用新型涉及聲學(xué)技術(shù)領(lǐng)域,具體而言,涉及一種便攜式可視化麥克風(fēng)陣列裝置。背景技術(shù):在某些隱蔽要求高的安保、安防等領(lǐng)域,對(duì)于中遠(yuǎn)距離聲音獲取途徑的保密性要求很高。目前中遠(yuǎn)距離聲音的獲取主要依靠規(guī)模較大的麥克風(fēng)陣列裝置來(lái)獲取,諸如申請(qǐng)公布號(hào)的發(fā)明專利,該設(shè)備的尺寸厚度較厚,攜帶不便,操作困難,很容易在安保安防中暴露設(shè)備的使用。技術(shù)實(shí)現(xiàn)要素:發(fā)明目的:本實(shí)用新型提供了一種便攜式可視化麥克風(fēng)陣列,旨在解決現(xiàn)有技術(shù)中麥克風(fēng)陣列操作復(fù)雜,攜帶不便,容易暴露,隱蔽性差等問(wèn)題。技術(shù)方案:為實(shí)現(xiàn)上述發(fā)明目的,本實(shí)用新型采用以下技術(shù)方案:一種便攜式可視化麥克風(fēng)陣列裝置,包括包體,設(shè)置在包體內(nèi)的印刷電路板、音頻采集裝置、視頻采集裝置、無(wú)線模塊和供電裝置,以及便攜式操作終端;包體的正面設(shè)有一圖像出孔,視頻采集裝置安裝在印刷電路板上,且其鏡頭正對(duì)圖像出孔,音頻采集裝置陣列式排布在印刷電路板上,無(wú)線模塊分別與視頻采集裝置和音頻采集裝置電連接,供電裝置為音頻采集裝置、視頻采集裝置和無(wú)線模塊供電,便攜式操作終端和無(wú)線模塊無(wú)線電連接??蛇x的,印刷電路板上設(shè)有圖像采集裝置安裝孔和聲音出孔陣列。湖南數(shù)字麥克風(fēng)陣列特征復(fù)雜的麥克風(fēng)陣列主要應(yīng)用于工業(yè)和**領(lǐng)域,消費(fèi)領(lǐng)域考慮到成本會(huì)簡(jiǎn)化很多。
本發(fā)明涉及室內(nèi)位置服務(wù)領(lǐng)域,具體是一種基于不同麥克風(fēng)陣列拓?fù)浣Y(jié)構(gòu)分析的室內(nèi)聲源定位方法。背景技術(shù):語(yǔ)音是人們進(jìn)行信息交流有效的方式之一。在利用數(shù)字音頻技術(shù)的通信系統(tǒng)中,人們利用麥克風(fēng)采集語(yǔ)音信號(hào),對(duì)語(yǔ)音信號(hào)進(jìn)行處理或存儲(chǔ),以應(yīng)用于人機(jī)交互、視頻會(huì)議、遠(yuǎn)程傳輸?shù)?。設(shè)是聲源與麥克風(fēng)陣列的距離,是麥克風(fēng)陣列孔徑,是聲源的工作波長(zhǎng),則在麥克風(fēng)近場(chǎng)條件下,即當(dāng)成立時(shí),麥克風(fēng)所采集的語(yǔ)音信號(hào)可以被認(rèn)為無(wú)噪聲干擾的信號(hào),具有較高的話音質(zhì)量。然而,在很多情況下,這一條件并不滿足,如在人機(jī)交互、視頻會(huì)議等場(chǎng)合,說(shuō)話的人通常處于陣列遠(yuǎn)場(chǎng)。因此,在陣列遠(yuǎn)場(chǎng)的情況下,麥克風(fēng)接收信號(hào)中將不可避免地混雜有較強(qiáng)的環(huán)境噪聲、反射聲、方向性干擾等,使拾取的語(yǔ)音信號(hào)質(zhì)量降低。單通道語(yǔ)音無(wú)法做到準(zhǔn)確的聲源定位與,因此聲源定位與的算法一般針對(duì)多通道語(yǔ)音而言。常用的多通道聲源定位技術(shù)有三類:1.基于聲達(dá)時(shí)間差的方法,該方法是在較低信噪比和較強(qiáng)混響條件下,現(xiàn)有的時(shí)延估計(jì)方法誤差都較大,此外,這類定位方法適合于單個(gè)聲源,很難用于多聲源定位;2.基于辨譜估計(jì)的方法,該方法能做到定向,在精細(xì)定位上精度很差。
提取出每個(gè)麥克風(fēng)所對(duì)應(yīng)的音頻信號(hào)、……;(3)將聲源空間劃分成多個(gè)網(wǎng)格,并依次求網(wǎng)格上每一個(gè)點(diǎn)的功率(,功率大的點(diǎn)即是聲源定位的點(diǎn)=(;(4)任意一個(gè)點(diǎn)的總功率()為是麥克風(fēng)陣列上所有麥克風(fēng)對(duì)的信號(hào)兩兩做基于相位變換的廣義互相關(guān)并求和:()=其中k、l第k、l個(gè)麥克風(fēng),表示相位變換的權(quán)重,τ()表示從聲音從位置x到達(dá)第k個(gè)麥克風(fēng)的時(shí)間;式中將定義為組合加權(quán)函數(shù):考慮到計(jì)算()所涉及的對(duì)稱性,并去掉一些固定能量項(xiàng),則()隨x變化的部分為:=(5)在整個(gè)房間內(nèi)進(jìn)行全局搜索,利用隨機(jī)區(qū)域收縮算法(src)得到能量大的坐標(biāo)點(diǎn)y;在所給定的初始值中隨機(jī)找出一個(gè)n維的矩陣,在順序過(guò)程中,逐步縮小范圍,直到達(dá)到足夠小的范圍,找出峰值;從而計(jì)算出定位坐標(biāo)點(diǎn)。步驟(4)中,為了簡(jiǎn)化計(jì)算可以替換為:=步驟(5)中,所述隨機(jī)區(qū)域收縮算法的過(guò)程如下:1)先定義i為迭代的次數(shù),表示第i次迭代時(shí)隨機(jī)抽取的點(diǎn)數(shù),表示下一代的子搜索空間中包含的點(diǎn)數(shù),表示下一代子搜索空間。定義每計(jì)算一次便記為一次,表示第i次迭代后的次數(shù),表示停止值,φ表示大被允許計(jì)算的次數(shù)。表示新的子搜索空間的邊界;2)初始化迭代次數(shù)i=0;3)設(shè)置初始參數(shù):、,;4)計(jì)算中所有的值。旨在解決現(xiàn)有技術(shù)中麥克風(fēng)陣列操作復(fù)雜,攜帶不便,容易暴露,隱蔽性差等問(wèn)題。
這涉及了語(yǔ)音交互用戶場(chǎng)景的變化,當(dāng)用戶從手機(jī)切換到類似Echo智能音箱或者機(jī)器人的時(shí)候,實(shí)際上麥克風(fēng)面臨的環(huán)境就完全變了,這就如同兩個(gè)人竊竊私語(yǔ)和大聲嘶喊的區(qū)別。前幾年,語(yǔ)音交互應(yīng)用為普遍的就是以Siri為的智能手機(jī),這個(gè)場(chǎng)景一般都是采用單麥克風(fēng)系統(tǒng)。單麥克風(fēng)系統(tǒng)可以在低噪聲、無(wú)混響、距離聲源很近的情況下獲得符合語(yǔ)音識(shí)別需求的聲音信號(hào)。但是,若聲源距離麥克風(fēng)距離較遠(yuǎn),并且真實(shí)環(huán)境存在大量的噪聲、多徑反射和混響,導(dǎo)致拾取信號(hào)的質(zhì)量下降,這會(huì)嚴(yán)重影響語(yǔ)音識(shí)別率。而且,單麥克風(fēng)接收的信號(hào),是由多個(gè)聲源和環(huán)境噪聲疊加的,很難實(shí)現(xiàn)各個(gè)聲源的分離。這樣就無(wú)法實(shí)現(xiàn)聲源定位和分離,這很重要,因?yàn)檫€有一類聲音的疊加并非噪聲,但是在語(yǔ)音識(shí)別中也要抑制,就是人聲的干擾,語(yǔ)音識(shí)別顯然不能同時(shí)識(shí)別兩個(gè)以上的聲音。顯然,當(dāng)語(yǔ)音交互的場(chǎng)景過(guò)渡到以Echo、機(jī)器人或者汽車為主要場(chǎng)景的時(shí)候,單麥克風(fēng)的局限就凸顯出來(lái)。為了解決單麥克風(fēng)的這些局限性,利用麥克風(fēng)陣列進(jìn)行語(yǔ)音處理的方法應(yīng)時(shí)而生。麥克風(fēng)陣列由一組按一定幾何結(jié)構(gòu)(常用線形、環(huán)形)擺放的麥克風(fēng)組成,對(duì)采集的不同空間方向的聲音信號(hào)進(jìn)行空時(shí)處理。麥克風(fēng)陣列發(fā)展趨勢(shì)多傳感器的融合。湖南數(shù)字麥克風(fēng)陣列特征
麥克風(fēng)陣列,麥克風(fēng)按一定的形狀規(guī)則布置形成的陣列,是對(duì)空間傳播聲音信號(hào)進(jìn)行空間采樣的一種裝置。上海電子類麥克風(fēng)陣列服務(wù)標(biāo)準(zhǔn)
而且受使用時(shí)長(zhǎng)以及室內(nèi)復(fù)雜環(huán)境等多種復(fù)合因素的影響,導(dǎo)致麥克風(fēng)陣列接收信號(hào)的頻率響應(yīng)特性與理論值存在較大偏差,這些偏差會(huì)使定位精度下降,因此,對(duì)麥克風(fēng)陣列頻率響應(yīng)的校準(zhǔn)對(duì)于室內(nèi)移動(dòng)聲源定位精度的進(jìn)一步提升具有重要意義。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的目的是針對(duì)上述缺陷,而提供一種基于不同麥克風(fēng)陣列拓?fù)浣Y(jié)構(gòu)分析的室內(nèi)聲源定位方法。該方法利用設(shè)置不同拓?fù)浣Y(jié)構(gòu)的麥克風(fēng)陣列獲取語(yǔ)音信號(hào),進(jìn)行基于相位變換加權(quán)的可控相應(yīng)功率的定位算法,加上隨機(jī)區(qū)域收縮的優(yōu)化算法,從定位結(jié)果上分析了各個(gè)麥克風(fēng)陣列性能的優(yōu)劣,并且針對(duì)在真實(shí)室內(nèi)環(huán)境中,麥克風(fēng)陣列與說(shuō)話人(聲源)之間存在干擾的情況下,聲源定位能力不足的實(shí)際問(wèn)題,提出一種多通道低通濾波與多通道自適應(yīng)濾波融合的陣列校準(zhǔn)方案,使定位結(jié)果具有較高的精度。實(shí)現(xiàn)本發(fā)明目的的技術(shù)方案是:一種基于不同麥克風(fēng)陣列拓?fù)浣Y(jié)構(gòu)分析的室內(nèi)聲源定位方法,包括如下步驟:(1)設(shè)置麥克風(fēng)陣列室內(nèi)聲源定位系統(tǒng),該系統(tǒng)由順序連接的麥克風(fēng)陣列拓?fù)浣Y(jié)構(gòu)分析模塊、陣列自適應(yīng)濾波校正模塊和聲源定位算法及分析模塊構(gòu)成;(2)提取語(yǔ)音信號(hào):在室內(nèi)布置合適的麥克風(fēng)陣列,說(shuō)話人發(fā)聲,錄下說(shuō)話人的語(yǔ)音。上海電子類麥克風(fēng)陣列服務(wù)標(biāo)準(zhǔn)
深圳魚亮科技有限公司在同行業(yè)領(lǐng)域中,一直處在一個(gè)不斷銳意進(jìn)取,不斷制造創(chuàng)新的市場(chǎng)高度,多年以來(lái)致力于發(fā)展富有創(chuàng)新價(jià)值理念的產(chǎn)品標(biāo)準(zhǔn),在廣東省等地區(qū)的通信產(chǎn)品中始終保持良好的商業(yè)口碑,成績(jī)讓我們喜悅,但不會(huì)讓我們止步,殘酷的市場(chǎng)磨煉了我們堅(jiān)強(qiáng)不屈的意志,和諧溫馨的工作環(huán)境,富有營(yíng)養(yǎng)的公司土壤滋養(yǎng)著我們不斷開拓創(chuàng)新,勇于進(jìn)取的無(wú)限潛力,深圳魚亮科技供應(yīng)攜手大家一起走向共同輝煌的未來(lái),回首過(guò)去,我們不會(huì)因?yàn)槿〉昧艘稽c(diǎn)點(diǎn)成績(jī)而沾沾自喜,相反的是面對(duì)競(jìng)爭(zhēng)越來(lái)越激烈的市場(chǎng)氛圍,我們更要明確自己的不足,做好迎接新挑戰(zhàn)的準(zhǔn)備,要不畏困難,激流勇進(jìn),以一個(gè)更嶄新的精神面貌迎接大家,共同走向輝煌回來(lái)!
ABOUT US
柳州市山泰氣體有限公司