谷歌推出反應(yīng)速度更快的語音助手,或?qū)⒋驍IRI和ALEXA
人們經(jīng)常向Siri和Alexa這樣的語音助手打招呼,讓語音助手來服務(wù)自己,但是語音助手可能會反應(yīng)很慢,而且這種體驗可能也會時不時地出現(xiàn)故障。
周二,谷歌展示了一項新技術(shù),該技術(shù)能顯著提高語音識別的響應(yīng)能力,這表明語音識別可能很快就會讓人無法抗拒。
在山景城的年度開發(fā)者大會上,谷歌吹噓其語音識別軟件縮小到其先前尺寸的1/25。首席執(zhí)行官Sundar Pichai稱這是一個里程碑,因為它意味著云服務(wù)器中的軟件可以安裝在Pixel智能手機(jī)中,使系統(tǒng)能夠更快地響應(yīng)一個人的聲音。
在星期二的一系列演示中,谷歌展示的手機(jī)可以在發(fā)出聲音時識別文字,而不是將音頻發(fā)送到遠(yuǎn)程服務(wù)器。更快的響應(yīng)速度可能會改變?nèi)藗兣c手機(jī)的關(guān)系。在所示的一個場景中,谷歌的虛擬助手比Siri等競爭對手顯得更加強(qiáng)大。
在該演示中,谷歌員工梅吉·霍林格(Meggie Hollinger)展示了她如何能夠通過一系列語音命令輕松地在手機(jī)上完成工作。而且每一項都比Siri更快地完成。
為了向朋友發(fā)送最近一次假期的照片,霍林格只說了兩句話,三個短語:“給我看黃石公園照片,有關(guān)動物的,把它發(fā)給賈斯汀!睅酌腌娭畠(nèi),谷歌的照片應(yīng)用程序搜索了她的收藏夾,并且顯示出一只野牛的照片。
谷歌人工智能首席執(zhí)行官杰夫迪恩在推特上表示這個語音識別功能會改變你與手機(jī)互動的方式。
現(xiàn)代語音助手是2012年人工智能研究的產(chǎn)物,這表明深度學(xué)習(xí)技術(shù)可以使語音識別更加準(zhǔn)確。谷歌表示,該技術(shù)將錯誤率降低了25%。但是,向云端發(fā)送音頻會限制速度,并由于網(wǎng)絡(luò)錯誤而產(chǎn)生故障。
谷歌花了數(shù)年時間研究如何縮小深度學(xué)習(xí)軟件,并在2019年將其語音識別模型降至一個很低的門檻。
該公司周二表示,最新版本的谷歌云端服務(wù)器語音識別軟件包的大小約為2千兆字節(jié),而且可以在智能手機(jī)上運(yùn)行。
語音識別明顯比第一代基于云的深度學(xué)習(xí)技術(shù)快得多,可能會促使用戶更頻繁地使用語音命令并查詢。它還可能使谷歌的設(shè)備和服務(wù)比蘋果和亞馬遜等競爭對手更加強(qiáng)大。
Gartner的研究主管Werner Goertz稱,轉(zhuǎn)向語音設(shè)備識別可能會改變游戲規(guī)則。這可能是蘋果和亞馬遜更傳統(tǒng)語音系統(tǒng)面臨的重大挑戰(zhàn)。
谷歌還利用其技術(shù)為其未來的手機(jī)Live Caption創(chuàng)建了一項新功能。激活后,屏幕上會顯示手機(jī)上播放的任何語音的字幕,例如來自朋友的視頻或播客。由于是在手機(jī)上進(jìn)行的,因此即使在飛行模式下也能正常工作。

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?