雷軍國(guó)慶將網(wǎng)友“罵”了整整七天!AI語(yǔ)音方向錯(cuò)了?
只需3秒,你的聲音就能被完美克隆。
誰(shuí)能想到科技圈頂流之一的雷軍,居然因?yàn)锳I語(yǔ)音引起互聯(lián)網(wǎng)熱議?
國(guó)慶期間,小雷的抖音首頁(yè)幾乎被雷軍的AI語(yǔ)音包刷屏。視頻中的“雷軍”用熟悉的口音帶著些許不耐煩的語(yǔ)氣,戲謔地吐槽:“這游戲做成這樣,絕對(duì)是來(lái)?yè)v亂的!”由于這些用詞與雷軍本人十分相似,評(píng)論區(qū)也常有人問(wèn)到:“這真是雷軍本人說(shuō)的嗎?”
(圖源:抖音)
因神似雷軍說(shuō)話的語(yǔ)氣和口音,這些語(yǔ)音包已經(jīng)在短視頻平臺(tái)迅速走紅。但隨著這股雷軍AI語(yǔ)音熱潮席卷網(wǎng)絡(luò),除了給網(wǎng)友們帶來(lái)歡樂(lè),也掀起了更深層次的討論。AI語(yǔ)音技術(shù)的快速發(fā)展正深刻地改變著我們的生活,而它的濫用則讓我們意識(shí)到,這項(xiàng)技術(shù)帶來(lái)的不只是便利,還有潛在的風(fēng)險(xiǎn):如果雷軍的聲音可以如此輕松地被復(fù)制和惡搞,那在生活中,其他人的聲音是否也會(huì)面臨相同的風(fēng)險(xiǎn)呢?
惡搞雷軍,AI語(yǔ)音方向錯(cuò)了?
實(shí)際上,在雷軍AI語(yǔ)音出圈之前,已經(jīng)有不少明星“中招”。去年末,美國(guó)某知名歌手AI語(yǔ)音視頻頻頻出圈,視頻中的她不僅能說(shuō)這一口流利的中文,甚至還發(fā)表了一些政治傾向明顯的言論,引起巨大爭(zhēng)議。該名歌手的團(tuán)隊(duì)也在了解此事后迅速發(fā)文澄清,但已經(jīng)有不少網(wǎng)友信以為真,造成了影響。
作為當(dāng)代最快實(shí)現(xiàn)普適化的AI技術(shù)之一,AI語(yǔ)音其實(shí)在我們生活中已經(jīng)相當(dāng)流行,例如抖音早早就推出了AI配音功能,讓創(chuàng)作者可以輸入一段文字后使用AI進(jìn)行語(yǔ)音生成,還能模仿不同的口音,不同的人物角色語(yǔ)氣等。
(圖源:剪映)
AI語(yǔ)音主要分為5種模式,分別是語(yǔ)音合成、語(yǔ)音克隆、語(yǔ)音識(shí)別、深度偽造和自然語(yǔ)言處理。大多數(shù)創(chuàng)作者在偽造名人AI語(yǔ)音時(shí),都會(huì)使用多種模式進(jìn)行炮制,比如雷軍的AI語(yǔ)音包,顯然使用了語(yǔ)音合成、語(yǔ)音克隆、深度偽造音頻以及自然語(yǔ)言處理的結(jié)合。這些技術(shù)共同作用,使得AI生成的語(yǔ)音能夠高度逼真地模仿雷軍的聲音和語(yǔ)氣,為用戶提供了一種“真假難辨”的體驗(yàn)。
當(dāng)然,假如AI語(yǔ)音合成僅僅停留在惡搞的層面上,或許還不至于讓網(wǎng)友們開(kāi)始擔(dān)憂這項(xiàng)技術(shù)的安全性。根據(jù)美國(guó)聯(lián)邦貿(mào)易委員會(huì)(FTC)的數(shù)據(jù),2022年因親友冒充詐騙導(dǎo)致的損失高達(dá)2.6億美元,其中很多案件使用了AI語(yǔ)音克隆技術(shù) 。詐騙者通常只需幾秒鐘的語(yǔ)音片段,就能輕松模仿受害者親友的聲音,發(fā)起“緊急求助”的詐騙。這類騙局在美國(guó)、英國(guó)和印度等地頻發(fā),且常以老人和年輕人作為目標(biāo),讓人防不勝防。
AI語(yǔ)音之所以能夠快速席卷全球,并被不法分子利用到行騙當(dāng)中,其實(shí)與其發(fā)展勢(shì)頭過(guò)猛也脫不開(kāi)關(guān)系。比如專注于AI語(yǔ)音技術(shù)研究的ElevenLabs,在前兩年就開(kāi)發(fā)出了通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),平臺(tái)能夠識(shí)別和模仿獨(dú)特的發(fā)音模式,并復(fù)現(xiàn)這些特征,適用于個(gè)性化內(nèi)容制作,例如創(chuàng)建定制的虛擬助手聲音的技術(shù)。
(圖源:剪映)
更重要的是,ElevenLabs率先在提供了高保真的聲音克隆特性,這使得大多數(shù)創(chuàng)造者都能通過(guò)它獲得非常逼真的AI語(yǔ)音音頻。
不過(guò),縱使AI語(yǔ)音引起了大眾對(duì)安全性的擔(dān)憂,但它的到來(lái)還是為人類進(jìn)入到AGI(通用人工智能技術(shù))時(shí)代提供了最基礎(chǔ)的技術(shù)支持,例如自然語(yǔ)言交流對(duì)話,這幾乎出現(xiàn)在所有主流AI工具上,OpenAI、Google、蘋果,都將這項(xiàng)技術(shù)視為最重要的交互模式。
AI語(yǔ)音被濫用,如何防詐成關(guān)鍵
多數(shù)普通用戶最常接觸到的AI語(yǔ)音造假,基本上都是惡搞名人語(yǔ)音包進(jìn)行視頻重新配音輸出的內(nèi)容,比如雷軍。這些惡搞視頻不乏粗鄙語(yǔ)言和不當(dāng)言論,不僅損害了名人的個(gè)人形象,還加劇了網(wǎng)絡(luò)暴力的蔓延 。這些內(nèi)容在社交媒體上廣泛傳播,誤導(dǎo)了公眾輿論,甚至讓人難以分辨真?zhèn),降低了人們?duì)社交媒體平臺(tái)的信任。
而雷軍也在個(gè)人社交賬號(hào)上用三個(gè)emoji表情回應(yīng)了近期AI語(yǔ)音出圈的事情,但并沒(méi)有表明要采取任何法律手段。當(dāng)然,這是因?yàn)槔总姷腁I語(yǔ)音多數(shù)都出現(xiàn)在抖音這樣的短視頻平臺(tái)上,而抖音很早就使用了AI技術(shù)的檢測(cè)工具,能夠在視頻內(nèi)容里標(biāo)注相關(guān)風(fēng)險(xiǎn),很大程度上避免了可能存在的糾紛和誤會(huì)。
(圖源:微博)
但不法分子往往會(huì)將AI語(yǔ)音克隆技術(shù)應(yīng)用到金融詐騙上,這種讓人無(wú)法分辨真假的語(yǔ)音包,的確存在較大的風(fēng)險(xiǎn)。
然而,面對(duì)AI語(yǔ)音濫用帶來(lái)的風(fēng)險(xiǎn),各界已經(jīng)開(kāi)始采取措施以加強(qiáng)防范。銀行和金融機(jī)構(gòu)首先意識(shí)到了多重身份驗(yàn)證的重要性。例如,英國(guó)的一家在線銀行在強(qiáng)化生物識(shí)別和短信驗(yàn)證后,大幅減少了因語(yǔ)音詐騙而造成的損失。除了多因素驗(yàn)證,銀行還可以通過(guò)AI技術(shù)監(jiān)控潛在的語(yǔ)音欺詐行為,從而有效地保護(hù)用戶資金安全。
AI技術(shù)提供商同樣意識(shí)到自身的責(zé)任。ElevenLabs等公司在發(fā)現(xiàn)其技術(shù)被濫用后,迅速推出了檢測(cè)工具,并嚴(yán)格限制了未付費(fèi)用戶的訪問(wèn)權(quán)限。這不僅可以幫助用戶識(shí)別虛假音頻,還能減少惡意濫用的機(jī)會(huì)。AI公司應(yīng)當(dāng)進(jìn)一步發(fā)展檢測(cè)技術(shù),與政府和行業(yè)組織合作,確保AI語(yǔ)音技術(shù)在合法、合理的范圍內(nèi)使用。
(圖源:ElevenLabs)
除了監(jiān)管機(jī)構(gòu)和AI技術(shù)提供商的防詐措施之外,我們普通用戶也需要警惕AI語(yǔ)音詐騙。
首先,許多安全專家建議在家人之間設(shè)置一個(gè)僅彼此知曉的“安全詞”。這種詞匯不僅僅是防止假冒親友的有效手段,更是為了在緊急情況中迅速確認(rèn)身份。McAfee的研究表明,AI只需三秒鐘的音頻樣本即可生成相似度達(dá)85%的語(yǔ)音克隆,增加這種簡(jiǎn)單的身份驗(yàn)證步驟,可以為我們提供額外的安全保障 。
在保護(hù)個(gè)人隱私方面,我們需要時(shí)刻謹(jǐn)慎對(duì)待自己在社交媒體上分享的內(nèi)容。AI詐騙者通常利用公開(kāi)的音頻和視頻資料來(lái)生成虛假聲音,社交媒體上的信息可能會(huì)成為他們的“素材庫(kù)”。因此,盡量控制隱私設(shè)置,不要隨意上傳自己的語(yǔ)音或視頻內(nèi)容。保持低調(diào)的網(wǎng)絡(luò)存在感,能夠降低被不法分子盯上的可能性。
(圖源:ElevenLabs)
比如,在短視頻平臺(tái)分享生活時(shí),盡可能不使用自己的原聲,或者是使用AI工具對(duì)自己的聲音進(jìn)行處理后再發(fā)布。
而在金融防詐部分,我們也可以選擇啟用多因素身份驗(yàn)證,這是一種增加安全性的身份驗(yàn)證方法,要求用戶提供兩個(gè)或更多的驗(yàn)證信息。例如,在金融交易中,除了語(yǔ)音驗(yàn)證外,銀行可能還會(huì)要求用戶輸入一次性密碼(OTP)或使用生物識(shí)別技術(shù),如指紋識(shí)別,以進(jìn)一步驗(yàn)證身份。這種方法可以有效防止AI語(yǔ)音克隆帶來(lái)的風(fēng)險(xiǎn)。
最后,也是最重要的,我們需要提高識(shí)別AI語(yǔ)音的敏銳度。盡管AI技術(shù)能夠模擬聲音的情緒和語(yǔ)調(diào),但有時(shí)會(huì)存在細(xì)微的失真或不連貫。比如,目前雷軍的AI語(yǔ)音在短視頻平臺(tái)十分火爆,但仔細(xì)聆聽(tīng)這些用AI工具克隆的語(yǔ)音,我們還是能發(fā)現(xiàn)詞語(yǔ)與詞語(yǔ)之間的不連貫性,這也有助于我們分辨這些聲音是否來(lái)自本人。
寫在最后
AI語(yǔ)音技術(shù)的迅猛發(fā)展不僅帶來(lái)了諸多便利,同時(shí)也暴露出一系列新的社會(huì)風(fēng)險(xiǎn)。雷軍AI語(yǔ)音包的爆火提醒我們,這項(xiàng)技術(shù)在為娛樂(lè)和搞笑視頻提供素材的同時(shí),也可能成為詐騙者手中的利器。AI語(yǔ)音濫用現(xiàn)象迫使我們反思科技發(fā)展的雙刃劍效應(yīng)。
未來(lái),防范AI語(yǔ)音詐騙不僅是個(gè)人和企業(yè)的責(zé)任,更需要技術(shù)提供商和社會(huì)各界攜手合作,建立一個(gè)更加安全和可信的科技環(huán)境。技術(shù)的進(jìn)步應(yīng)當(dāng)服務(wù)于社會(huì),而非成為破壞社會(huì)信任的工具。唯有在監(jiān)管、技術(shù)創(chuàng)新與公共意識(shí)三者之間找到平衡,才能真正實(shí)現(xiàn)科技的價(jià)值。
來(lái)源:雷科技
原文標(biāo)題 : 雷軍國(guó)慶將網(wǎng)友“罵”了整整七天!AI語(yǔ)音方向錯(cuò)了?

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?