拍照眨眼怎么辦?Facebook的AI新研究讓你“眼界大開”
現(xiàn)代生活中,我們P圖的方式多種多樣,比如去除紅眼、鏡頭曝光,等等。但是,拍照眨眼仍然很難處理。不過,最近Facebook的一項AI新研究能夠讓照片中閉眼的你“眼界大開”。
這一技術(shù)被譽為智能“內(nèi)畫”(intelligent in-painting),用開眼代替閉眼只是其中的用例之一。簡單來說,就是程序會自動向空間填充那些它認為本該存在里面的東西。Adobe目前已經(jīng)在”上下文感知檢索“中充分利用了這項技術(shù),讓用戶能夠無縫替換掉那些不想要的功能。
當然,替換眼睛是這項技術(shù)面臨的挑戰(zhàn)之一。因為,眼睛具有復雜性和多變性的特點,所以系統(tǒng)很難改變或者是創(chuàng)建此類內(nèi)容。
不過,由于Facebook掌握巨大的圖片數(shù)據(jù)庫,擁有許多人眨眼的照片,所以決定要嘗試去破解這個難題。
想要實現(xiàn)這一點,就需要依靠生成式對抗性網(wǎng)絡(Generative Adversarial Network,以下簡稱GAN),其本質(zhì)上就是一個機器學習系統(tǒng)。這個系統(tǒng)要學會欺騙自己,讓自己覺得所造的事物是真實可靠的。在GAN中,系統(tǒng)的其中一部分要學習去識別內(nèi)容,而另一部分則負責去創(chuàng)造內(nèi)容。當然,內(nèi)容創(chuàng)造會根據(jù)內(nèi)容識別的反饋信息來進行。
在這一條件下,這個網(wǎng)絡既能夠識別眼周環(huán)境,同時也能創(chuàng)建一雙眼睛。正如上圖所示,目前這項技術(shù)已經(jīng)可以使用了,但是仍有一些不太理想的地方。系統(tǒng)似乎只是單一地復制粘貼人類的眼睛,但是并沒有考慮到圖像的一致性。
機器就是這么傻,他們沒有辦法理解的是,當人們睜開眼睛時,眼周的顏色并不會隨之改變;蛘邠Q句話說,機器對于眼睛、顏色等信息都沒有直觀理解。
在Facebook研究人員輸入的樣本數(shù)據(jù)中,實驗對象的眼睛都是睜開的。這樣一來,GAN就能了解到眼睛在人體的位置、特定的形狀,以及顏色,等等。
結(jié)果顯示,并沒有明顯的色差或者是縫合痕跡。這是因為,系統(tǒng)中負責識別的部分非常清楚,真實的人類不長那樣兒。
在測試中,人們經(jīng)常會沒辦法判斷,哪些照片是真的睜眼,哪些只是系統(tǒng)模擬的睜眼照片;誤判率高達一半以上。
當然,這個系統(tǒng)也并非十全十美。在某些情況下,其仍然會出現(xiàn)失誤。比如說,當一個人的眼睛被頭發(fā)遮蓋住,或者是顏色矯正出現(xiàn)偏差的時候,系統(tǒng)生成的照片中就會出現(xiàn)一些奇怪的陰影。當然,這些問題都是可以解決的。
可以想象,當Facebook未來某天在平臺上審閱用戶照片的時候,如果一旦發(fā)現(xiàn)某個用戶的照片閉眼了,那么它就會自動用這個系統(tǒng)把用戶眼睛打開…說實話,這是有點讓人毛骨悚然。但是,至少這個系統(tǒng)可能可以拯救你相冊里面的不少照片。

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風翻身?