閱讀 | 訂閱
閱讀 | 訂閱
3D新聞

科學家借用3D打印技術解決“雞尾酒會問題”

星之球激光 來源:天工社2015-08-13 我要評論(0 )   

在計算機語音識別領域有一個著名的難題雞尾酒會問題(Cocktail Party Problem),說的是當前語音識別技術已經(jīng)可以以較高精度識別


在計算機語音識別領域有一個著名的難題——“雞尾酒會問題(Cocktail Party Problem)”,說的是當前語音識別技術已經(jīng)可以以較高精度識別一個人所講的話,但是當說話的人數(shù)為兩人或者多人時,語音識別率就會極大的降低。計算機無法將目標聲音與其他人同時發(fā)出的聲音區(qū)別開來。

如今,來自美國杜克大學的科學家們使用一種簡單的3D打印裝置,巧妙地解決了這個問題??茖W家們?yōu)榇嗽凇?/span>Proceedings of the National Academy of Sciences》雜志上發(fā)表了一篇論文介紹了這個奇妙的3D打印解決方案。

他們首先制造出了一個又大又厚的3D打印塑料盤,在塑料盤的一面有36個開口,以及許多蜂窩狀的通道通向塑料盤中心的一個麥克風。它本質上是一個結合了聲學超材料和壓縮傳感技術的單一傳感器聽音系統(tǒng)。

 

“與以前的研究通常依賴于信號和語音處理技術來解決“雞尾酒會”問題不同,我們提出的方法是一個獨特的基于硬件的方法,主要利用了經(jīng)過精心設計的聲學超材料。”研究人員寫道,“我們堅信,這一方法不僅能夠解決過去數(shù)十年來各個領域的研究人員一直孜孜以求的雞尾酒會聽音問題,而且這種將物理層的設計與計算感知相結合的系統(tǒng)設計方法將會對傳統(tǒng)的聲學傳感和成像方式產(chǎn)生影響。”

這項研究是在Steven CummerYangbo Xie的領導下進行的。

 

那么它的工作原理到底是什么呢?研究人員稱,這36個通向麥克風的通道每個都有著獨特的3D打印形狀導致其功能特性有所區(qū)別,使得聲音傳向中心的方式有著微妙的不同,因而可以彼此區(qū)分,并被單個傳感器接收。Yangbo Xie稱,我們人類無法區(qū)分其中的差別,但是基于該傳感器的算法幾乎總是可以告訴我們這些聲音是從哪個想來的。

 

至于該解決方案的正確性。研究人員在其論文中宣稱:“這款帶有共振超材料緊湊陣列的設備被證明可以區(qū)分識別來自三個獨立來源的重疊音頻,正確率高達96.67%。”。這個簡單、但有效的方法已被人們譽為一個優(yōu)秀的解決方案。不過目前唯一的問題是它的大小——它大約相當于一個很厚的比薩,但是顯然它具有足夠的空間優(yōu)化設計,并用于進一步的應用。杜克大學的科學家們表示,它可以適用于助聽器等聲學成像和傳感應用,所以我們可能會在不久的將來看到這項技術的一個更小版本。

轉載請注明出處。

3D打印計算機語音識別“雞尾酒會問題”
免責聲明

① 凡本網(wǎng)未注明其他出處的作品,版權均屬于激光制造網(wǎng),未經(jīng)本網(wǎng)授權不得轉載、摘編或利用其它方式使用。獲本網(wǎng)授權使用作品的,應在授權范圍內使 用,并注明"來源:激光制造網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關責任。
② 凡本網(wǎng)注明其他來源的作品及圖片,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本媒贊同其觀點和對其真實性負責,版權歸原作者所有,如有侵權請聯(lián)系我們刪除。
③ 任何單位或個人認為本網(wǎng)內容可能涉嫌侵犯其合法權益,請及時向本網(wǎng)提出書面權利通知,并提供身份證明、權屬證明、具體鏈接(URL)及詳細侵權情況證明。本網(wǎng)在收到上述法律文件后,將會依法盡快移除相關涉嫌侵權的內容。

網(wǎng)友點評
0相關評論
精彩導讀