中國教育科技大會|作業(yè)幫發(fā)力OCR+AI技術(shù),持續(xù)打造技術(shù)壁壘
12月23日,2020中國教育科技大會于北京召開。本屆教育科技大會以“新業(yè)態(tài)·新動能·新教育”為主題,圍繞中國教育進(jìn)行深度剖析,并以最新、最全、最優(yōu)的視角,全方位深入教育本質(zhì),聚焦業(yè)態(tài)發(fā)展。作業(yè)幫智能技術(shù)實驗室負(fù)責(zé)人王巖出席會議,并進(jìn)行了《創(chuàng)新科技助力作業(yè)幫在線教育》主題演講,對教育科技的應(yīng)用和創(chuàng)新發(fā)表前瞻性觀點。
據(jù)了解,中國教育科技大會由中國計算機用戶協(xié)會指導(dǎo),iTechClub(互聯(lián)網(wǎng)技術(shù)精英俱樂部)教育專委會主辦,是國內(nèi)互聯(lián)網(wǎng)技術(shù)領(lǐng)域最專業(yè)、最具影響力的大型教育科技類行業(yè)盛會,通過站在行業(yè)前沿角度,以演講、分享、討論、交流等不同的方式,深耕教育科技本源,促進(jìn)中國教育行業(yè)的創(chuàng)新發(fā)展。
王巖表示,目前在線教育已經(jīng)進(jìn)入了新的發(fā)展階段,不僅需要對優(yōu)質(zhì)內(nèi)容進(jìn)行嚴(yán)格把控,同時還必須深耕用戶體驗。為此,作業(yè)幫持續(xù)更迭OCR技術(shù)進(jìn)階拍搜體系,以多線性思路兜底知識索取,同時發(fā)力AI技術(shù)在直播課中的深度應(yīng)用,打造強交互和場景化在線課堂。
作業(yè)幫拍搜技術(shù)向上突破,承接全國中小學(xué)生釋疑需求
近年來,作業(yè)幫拍照搜題成為全國中小學(xué)生快速獲取知識的重要工具。據(jù)王巖介紹,早期經(jīng)過研發(fā)和探索,作業(yè)幫拍搜系統(tǒng)在后臺開發(fā)及測試階段已經(jīng)能達(dá)到較高的準(zhǔn)確率!昂唵蝸砜矗跫壍奈淖肿R別基本框架僅分為前處理、文本行分割、文本識別和結(jié)果輸出四個部分。對于一位熟悉計算機視覺和深度學(xué)習(xí)的研究生而言,利用公開的資源和數(shù)據(jù)集,以及現(xiàn)成的深度學(xué)習(xí)框架,也許兩周內(nèi)就可以搭建出一個系統(tǒng),并能有效識別清晰圖片!
然而在實際上線之后,系統(tǒng)在識別過程中遇到難題。隨著用戶體量日益擴大,用戶使用設(shè)備、拍照習(xí)慣、題目呈現(xiàn)效果存在顯著差異性,從而產(chǎn)生模糊、傾斜、低像素、干擾等現(xiàn)象,使得實際識別準(zhǔn)確率下降。
為解決拍搜系統(tǒng)遇到的一系列問題,作業(yè)幫發(fā)力OCR識別技術(shù),自研拍搜架構(gòu)。王巖介紹,這套系統(tǒng)是作業(yè)幫通過持續(xù)5年的自主研發(fā)和數(shù)據(jù)積累,不斷進(jìn)行功能迭代的重要成果。在完整的文字識別流水線中,超過30種不同的神經(jīng)網(wǎng)絡(luò)各司其職,每做一次拍搜文字識別,將運行260個以上神經(jīng)網(wǎng)絡(luò)的預(yù)測。而如此復(fù)雜的算法,則通過大規(guī)模的并行化、集群化的服務(wù)器,實現(xiàn)200ms內(nèi)完成的極高效率,甚至可以對整張試卷進(jìn)行快速識別。
依托于自研的拍搜架構(gòu),作業(yè)能夠有效擊破用戶識別場景多元而衍生的系列問題,提升識別精準(zhǔn)性,幫助用戶實現(xiàn)提問與釋疑的無縫銜接,優(yōu)化知識獲取效率。
精準(zhǔn)識別+完整視頻講解+即時在線問答,作業(yè)幫搜題體系全面進(jìn)化
在快和準(zhǔn)上進(jìn)行極致化探索僅僅是拍照搜題功能升級的第一關(guān),將重心置于教學(xué)思路的講解和輸出,才是契合教育本質(zhì)的發(fā)展方向。
以教育普惠為核心理念作業(yè)幫早已孵化出完備的拍搜業(yè)務(wù)線,用戶在精準(zhǔn)匹配到題目之后,還能夠獲取詳細(xì)的解析過程以便于思考和歸納。同時,針對書面講解不夠直觀易懂的痛點,作業(yè)幫錄制了大量解題視頻,實現(xiàn)圖文并茂、細(xì)致解說。據(jù)了解,目前五成以上的搜索結(jié)果均配備講解視頻。此外,為全面兜底搜題需求,作業(yè)幫還設(shè)置真人老師在線答題,能夠針對學(xué)生疑問進(jìn)行進(jìn)一步解答,幫助用戶對題目考察內(nèi)容產(chǎn)生深入、透徹的理解,真正掌握知識點。
王巖介紹道,結(jié)構(gòu)化的拍搜體系不再是一項簡單的輔助型工具,而是穿透整個教研的重要力量。據(jù)了解,目前作業(yè)幫拍搜系統(tǒng)每分鐘可以處理100萬次的完整識別流水線,識別完成后,內(nèi)容立刻被傳送至搜索引擎,匯聚成包含超3億題目的海量題庫;陬}庫,作業(yè)幫還運用大數(shù)據(jù)算法深入洞察全網(wǎng)學(xué)習(xí)動態(tài),智能分析熱門知識點分布及難點,賦能自身及全國各地教研體系。
在拍搜系統(tǒng)、大數(shù)據(jù)和龐大用戶體量的多重加持下,作業(yè)幫教研團(tuán)隊可以快速明確某地區(qū)某時間甚至某學(xué)校中,最困擾學(xué)生的知識點、最容易錯的題目。此技術(shù)或?qū)⒂行椭逃块T制定教學(xué)計劃,提高教學(xué)效率,發(fā)揮在線教育的社會價值。
音視頻AI嵌入直播課架構(gòu),作業(yè)幫開啟學(xué)習(xí)場景化全面探索
不限于拍照搜題,作業(yè)幫還將直播課作為輸出優(yōu)質(zhì)教育資源的關(guān)鍵抓手,通過發(fā)力AI技術(shù),瞄準(zhǔn)線下教育特性,深入探索場景化學(xué)習(xí),匹配用戶對于課堂體驗的多重訴求。
具體而言,作業(yè)幫運用RTC協(xié)議自研音視頻互動直播技術(shù)架構(gòu),完整支持1對1輔導(dǎo)、一對多大班課、1對6小班互動課、多對多互動大班課等等各類班型。王巖介紹,這一套系統(tǒng)基于遍布全國的節(jié)點,可以為老師和學(xué)生提供足夠好的音視頻互動交互。其中,視覺AI的運用則能夠在直播課中實現(xiàn)監(jiān)測上課狀態(tài)、優(yōu)化課堂效果的雙向效果,拉齊線下課程面對面的教育價值,輻射全國孩子的學(xué)習(xí)圈,帶來在線教育的高位運行。
就課堂效果而言,作業(yè)幫面向低年級孩子推出自研課堂手勢交互功能,通過本地AI能力進(jìn)行準(zhǔn)確的手勢識別,規(guī)避了點選參與感不足的問題,提升課堂趣味性。語音彈幕功能則使用自研語音識別能力,避免打字互動時鍵盤遮擋影響教學(xué)效果的情況。
演講中,王巖分享了語音功能升級帶來的強互動性!霸谡Z言課程的拼讀環(huán)節(jié)中,可以給每一個學(xué)生都提供評價功能,在答題環(huán)節(jié),老師能請學(xué)生直接用語音彈幕回答,回答內(nèi)容將會被迅速識別,并在教師端進(jìn)行匯總!痹谧鳂I(yè)幫的直播課堂上,沒有一個孩子被“隱身”,每位學(xué)生都有公平互動和表達(dá)的機會,老師也可以掌握臺下所有學(xué)生的回答情況。
在對學(xué)生上課狀態(tài)的把握上,作業(yè)幫則利用部署在用戶終端的神經(jīng)網(wǎng)絡(luò)搭配云端集群,對學(xué)生進(jìn)行智能識別,包括是否在座位、是否有家人陪同上課、是否專心聽課、離屏幕的距離是否過近或過遠(yuǎn)。而主講老師通過學(xué)生狀態(tài)采集、課中實時匯總、課后分析報告,反哺老師教學(xué)能力,輔導(dǎo)老師則能夠運用專注力匯總,近距離與學(xué)生互動,全面感知學(xué)生個體。
基于近五年對于OCR、AI等教育技術(shù)的深耕,作業(yè)幫實現(xiàn)了在線教育效率化、實感化,化解了與線下教育的顯著區(qū)隔,并將彌補傳統(tǒng)課程的諸多壁壘,輻射多元學(xué)習(xí)場景。對于下一個五年的愿景,王巖表示,作業(yè)幫仍在對在線教育進(jìn)行更加深入的研究,今后也將持續(xù)聚焦教育科技,以成熟化的新技術(shù)強化學(xué)習(xí)場景感官,推動新教育行業(yè)的更大變革。

最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?