站在5G的視角上,百度AI+視頻確實大有可為
今年年初的時候,華為和沃達豐完成了首次5G通話測試,并成功實現(xiàn)了實時高清視頻通話。遺憾的是,這一標志性的事件并沒有在輿論中形成話題效應,大多數(shù)人對于5G的認知仍然停留在概念層面。
以至于當百度高級副總裁、百度搜索公司總裁向海龍在今年的百度聯(lián)盟生態(tài)峰會上提出 “擁抱視頻時代”的時候,部分媒體并沒有完全理解其中深意,將其指出的“視頻時代”與時下正在風口上的短視頻畫上了等號。短視頻的火爆可以算是即將到來的“視頻時代”的信號,但也僅僅是“視頻時代”的冰山一角而已,且百度的野心也遠不止于此。
問題的根源,還是要回到5G這個被視為下一代移動通信網(wǎng)絡的視角上。
信息載體的迭代:文字、圖片、視頻
技術迭代的節(jié)奏約束了人們的想象力,也左右了大多數(shù)人的認知。好比說已經普及的4G通信技術,給人的直觀印象是“快”,導致我們對于5G的理解就是網(wǎng)速更快。其實從信息載體迭代的角度,更容易跨過技術迭代所帶來的認知鴻溝。
先從1G時代說起,“大哥大”一度象征著財富和地位,只是很多人對這個時代都過于陌生,所知所感所想無不來自于電影片段里。1G技術的價值,無非是把必須連著線的固定電話,在功能上變成了比磚頭還要笨重的“大哥大”。
2G時代是手機連接互聯(lián)網(wǎng)的開始,準確地說是讓大家“嘗鮮”,在一寸見方的屏幕上瀏覽新聞、郵件等,文字幾乎是唯一的信息載體,應用場景自然比較局限,就連IM通訊也未能進化到語音溝通。
3G時代的手機開始成為名符其實的互聯(lián)網(wǎng)終端,3G網(wǎng)絡能夠處理圖像、音樂、流媒體等多種信息形式,諸如電商、游戲等五花八門的產品應用應運而生。不過對于經歷過那個時代的老網(wǎng)民而言,最深刻的印象還是圖片作為信息載體的流行,畢竟網(wǎng)速那么慢,游戲、視頻的體驗難言差強人意。
如果說3G打破了互聯(lián)網(wǎng)的門檻,邁入4G時代之后看到的是互聯(lián)網(wǎng)應用的繁榮,即時通訊、電商、移動支付、在線游戲、直播、短視頻等等。一言以蔽之,4G時代已經有了視頻作為信息載體的趨勢,只是受限于帶寬、可靠性、時延等因素,直播、短視頻成為4G時代的幸運兒,實時高清視頻、遠程交互等還需要5G來解決。
理清了這個邏輯,再來看向海龍對視頻時代的預言,興許就不至于有那么大的誤解。向海龍站在5G的視角上,預言人們的溝通方式將進入視頻時代,人與人之間的溝通不再需要文字、圖片等作為媒介,而是回歸到“指手畫腳的原始時代”,原因在于實時高清視頻等讓人們的溝通擺脫了時間和空間的限制。
作為旁觀者的大多數(shù)人,仍然從4G的視角上理解百度的新動作,觀點自然有些偏頗。同時向海龍觀點的前瞻性卻在資本層面得到了印證,流媒體公司Netflix的市值達到1536億美金,正式超過傳媒巨頭迪士尼,出發(fā)點正是5G給予視頻產業(yè)的機遇。
互聯(lián)網(wǎng)+到AI+,視頻成為百度AI的新場景
回到百度的問題上,一面是前景誘人的5G,一面是百度主張的AI戰(zhàn)略,二者沖突嗎?答案顯然是否定的。
同樣是在2016年的百度聯(lián)盟峰會上,李彥宏發(fā)表了題為“下一幕:人工智能”的演講下如果說互聯(lián)網(wǎng)的第一幕是PC互聯(lián)網(wǎng),這一幕是移動互聯(lián)網(wǎng),而移動互聯(lián)網(wǎng)的紅利期已經基本結束,那么下一幕是什么?李彥宏給出的答案是人工智能。
前幾年比較流行的說法是“互聯(lián)網(wǎng)+”,其實百度的策略已經是“AI+”。在出行場景上,百度的應對之策是AI+汽車的Apollo;在居家場景上,百度打造了AI+硬件的DuerOS;在理財場景上,百度推出了AI+金融的度小滿……而在內容消費場景上,百度已經打造了千人千面智能化推薦的信息流,在5G視頻時代來臨之際無疑將是AI+視頻。
為何在4G和WiFi看起來已經普及的背景下,視頻仍然只是文字、圖片等信息傳遞方式的補充?向海龍歸結了視頻應用的四個難點:生產難——視頻生產需要專業(yè)設備;存儲難——需要很大的存儲空間;傳輸難——傳輸速度慢和流量資費貴使得傳輸成本高;檢索難——基于語義理解和字面匹配的傳統(tǒng)檢索技術難以在視頻這種信息載體上直接應用。
折射到現(xiàn)實中來看,直播就是一個典型案例。受限于生產環(huán)節(jié)的痛點,大多數(shù)主播能做的只是改變背景布置,對于存儲、傳輸上的尷尬,當前直播APP的清晰度清一色的AV畫質,并且有著10秒左右的延時。
“擁抱視頻時代”并非只是一個口號,在內容場景上有著充足經驗的百度,正著手從AI的角度解決兩個問題:一個是內容生產,另一個是內容檢索。
比如要拍攝高質量的視頻內容,特效是不可或缺,這也是國產電影和好萊塢大片最為明顯的差別。百度的解決方案是通過AI的賦能讓視頻生產簡單化,利用百度AI的人體識別、形體美化、人景分離、語音識別、語音合成等能力,可以實現(xiàn)“瘦身”、“分身術”、“變身”等特效,為復雜視頻生產的簡單化提供了新出路。
更令人頭疼的還是視頻的檢索,當前流行的解決方案是人為給視頻打標簽或者添加文字描述,與智能化的目標相差甚遠。百度的解決之道同樣是AI,通過對視頻的全景掃描,利用語音識別、人臉識別、物體識別等技術完整分析視頻中的內容,將視頻背景、人物、語言等信息進行組合,可以給每個視頻生成一個獨特的“指紋”,大幅提升視頻檢索的效率和準確率。
雖然百度并未明確提及,但顯而易見的是,當視頻的“指紋”被生成,配合百度基于大數(shù)據(jù)建立的用戶畫像,視頻的分發(fā)將會前所未有的更加精準和智能。
可以預見的是,百度的AI技術以及5G時代的來臨,解決了內容生產、檢索和分發(fā)的問題,視頻作為主流信息載體已然在意料之中。
寫在最后
在未來面前,人類永遠都是個孩子。
至少百度讓我們看到了這樣的前景,5G時代視頻的應用將是顛覆性的:讓精密手術的遠程操作成為可能,盡可能地解決醫(yī)療資源的不平衡;躺在家里也能隨時學習高端教育課程,打破時間和空間的限制;和朋友的交流不再是枯燥的文字和斗圖,而是“面對面”的視頻溝通;以及習慣于用高清視頻來記錄生活……
其實百度的“新視代”也很簡單:只要哼唱一兩句歌曲,百度就能幫你檢索出這首歌的MV;只要用手機掃一下臉,就能找到一段視頻中所有關于你的片段;當你偶爾在網(wǎng)上看到一段小視頻,即刻就能找到視頻的完整版;不一而足。
或許到了三五年后,再來回頭審視百度當前的戰(zhàn)略布局和技術探索,已經不會再有質疑和不解,取而代之的是清一色的掌聲。

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?