哥倫比亞大學(xué)提出可阻止間諜麥克風(fēng)監(jiān)聽的神經(jīng)語音偽裝AI算法
2022-04-20 16:12:18 來源: 扣丁書屋
0瀏覽 評論0條
資料圖(來自:University of Wisconsin-Madison)
出于對隱私安全的關(guān)注,我們已見到一些突破性的技術(shù)。比如得益于新開發(fā)的一種算法,哥倫比亞大學(xué)研究人員聲稱可部分解決這方面的問題。
據(jù)悉,新算法主要聚焦兩個方面。首先,它會將一個人的語音模糊和安靜到接近耳語可聽的水平,以避免被自動語音識別(ASR)AI 給破譯。
其次,新算法還可預(yù)測即將說出的單詞、并始終較 ASR 領(lǐng)先一步,所以新方法又被稱作“預(yù)測性攻擊”(Predicitive Attacks)。
研究配圖 - 1:“神經(jīng)語音偽裝”可對 ASR 造成干擾
該校計(jì)算機(jī)科學(xué)助理教授 Carl Vondrick 簡要解釋了該技術(shù)的工作原理:
在阻止麥克風(fēng)惡意監(jiān)聽這件事上,我們的算法有 80% 的成效,同時也是測試平臺上最快、最準(zhǔn)確的算法。
即使我們對流氓麥克風(fēng)一無所知 —— 比如它的位置、甚至背后運(yùn)行的計(jì)算機(jī)軟件 —— 該方法依然能夠奏效。
本質(zhì)上,我們可以通過無線的方式來偽裝一個人的聲音,將其隱藏在這些監(jiān)聽系統(tǒng)之外、且不會對在室內(nèi)會話的人們造成不便。
研究配圖 - 2:預(yù)測攻擊演示
研究的主要作者、Vondrick 的博士生 Mia Chiquier 進(jìn)一步補(bǔ)充道:
我們的算法能夠通過預(yù)測一個人接下來會說什么的特征來跟上進(jìn)度,給它足夠的時間來生成正確的耳語。
到目前為止,該方法已被證明適用于大多數(shù)英語詞匯。后續(xù)我們計(jì)劃將該算法推廣到覆蓋更多語種,最終讓耳語聽起來完全不可察覺。
研究配圖 - 3:三個攻擊實(shí)例
通過與其它用于攻擊語音樣本的方法進(jìn)行比較 —— 包括統(tǒng)一噪聲、離線投影梯度下降(PGD)和在線 PGD(實(shí)時)—— 可知該算法在預(yù)測未來 0.5 秒的講述內(nèi)容時表現(xiàn)最佳。
此外該算法針對標(biāo)準(zhǔn) ASR 及其強(qiáng)大的對手展開了實(shí)測,雖然不見得很快就能派上實(shí)際用場,但感興趣的朋友還是可以翻閱《實(shí)時神經(jīng)語音偽裝》這項(xiàng)基礎(chǔ)研究的全文(PDF)。
標(biāo)簽: 哥倫比亞大學(xué) 一個人的 計(jì)算機(jī)軟件 一無所知 工作原理
傳化智聯(lián)旗下傳化支付打通產(chǎn)業(yè)端支付 助力實(shí)現(xiàn)數(shù)字
泉州民間傳統(tǒng)風(fēng)俗:中秋節(jié)拾瓦片燒塔仔 共賞江天月
讓木偶走進(jìn)尋常百姓家 給木偶行業(yè)帶來新希望
高安鎮(zhèn)坪水村特色村寨 自然資源與文化底蘊(yùn)并存
古代“儲錢罐”--元代陶撲滿 出土彌足珍貴陶撲滿





