哥倫比亞大學提出可阻止間諜麥克風監(jiān)聽的神經(jīng)語音偽裝AI算法
2022-04-20 16:12:18 來源: 扣丁書屋
0瀏覽 評論0條
資料圖(來自:University of Wisconsin-Madison)
出于對隱私安全的關注,我們已見到一些突破性的技術(shù)。比如得益于新開發(fā)的一種算法,哥倫比亞大學研究人員聲稱可部分解決這方面的問題。
據(jù)悉,新算法主要聚焦兩個方面。首先,它會將一個人的語音模糊和安靜到接近耳語可聽的水平,以避免被自動語音識別(ASR)AI 給破譯。
其次,新算法還可預測即將說出的單詞、并始終較 ASR 領先一步,所以新方法又被稱作“預測性攻擊”(Predicitive Attacks)。
研究配圖 - 1:“神經(jīng)語音偽裝”可對 ASR 造成干擾
該校計算機科學助理教授 Carl Vondrick 簡要解釋了該技術(shù)的工作原理:
在阻止麥克風惡意監(jiān)聽這件事上,我們的算法有 80% 的成效,同時也是測試平臺上最快、最準確的算法。
即使我們對流氓麥克風一無所知 —— 比如它的位置、甚至背后運行的計算機軟件 —— 該方法依然能夠奏效。
本質(zhì)上,我們可以通過無線的方式來偽裝一個人的聲音,將其隱藏在這些監(jiān)聽系統(tǒng)之外、且不會對在室內(nèi)會話的人們造成不便。
研究配圖 - 2:預測攻擊演示
研究的主要作者、Vondrick 的博士生 Mia Chiquier 進一步補充道:
我們的算法能夠通過預測一個人接下來會說什么的特征來跟上進度,給它足夠的時間來生成正確的耳語。
到目前為止,該方法已被證明適用于大多數(shù)英語詞匯。后續(xù)我們計劃將該算法推廣到覆蓋更多語種,最終讓耳語聽起來完全不可察覺。
研究配圖 - 3:三個攻擊實例
通過與其它用于攻擊語音樣本的方法進行比較 —— 包括統(tǒng)一噪聲、離線投影梯度下降(PGD)和在線 PGD(實時)—— 可知該算法在預測未來 0.5 秒的講述內(nèi)容時表現(xiàn)最佳。
此外該算法針對標準 ASR 及其強大的對手展開了實測,雖然不見得很快就能派上實際用場,但感興趣的朋友還是可以翻閱《實時神經(jīng)語音偽裝》這項基礎研究的全文(PDF)。
傳化智聯(lián)旗下傳化支付打通產(chǎn)業(yè)端支付 助力實現(xiàn)數(shù)字
泉州民間傳統(tǒng)風俗:中秋節(jié)拾瓦片燒塔仔 共賞江天月
讓木偶走進尋常百姓家 給木偶行業(yè)帶來新希望
高安鎮(zhèn)坪水村特色村寨 自然資源與文化底蘊并存
古代“儲錢罐”--元代陶撲滿 出土彌足珍貴陶撲滿





