AI的數(shù)據(jù)、算法、算力“輪流坐莊”,NLP到了“數(shù)據(jù)為王”的時代
它的需求可能只有初中語文即可。但是,NLP的數(shù)據(jù)需求早已超過這樣的標注太多。
例如,客服詢問用戶是否購買此商品時,“我要和家人商量一下”、“我會考慮”、“我現(xiàn)在不方便,你一會兒再打過來”,標注人員得準確標注出暫不購買,暫不考慮,拒絕購買或者興趣較大等多種意圖。
一方面,這依賴于平臺進行的場景深挖,這也是為什么云測數(shù)據(jù)智能客服單個場景的意圖標注就分為10-20個大類、上百個子類,根據(jù)業(yè)務需求可能還會有進一步的標注細分,如此數(shù)據(jù)標注可以更細化、直達需求。
另一方面,這繞不開人員能力的持續(xù)培訓,把“干體力”的標注工人轉化成懂一些專業(yè)的業(yè)務人員,典型的如云測數(shù)據(jù)在金融服務領域通過幾個月的專業(yè)培訓,培養(yǎng)出銷售人員視角去揣測用戶話語中的意圖。
舉例來看,在客服溝通中,用戶回饋“我在開車”這短短的一個語料數(shù)據(jù),可能需要標記出“有車一族”、“司機”、“沒有明顯拒絕”、“可能有興趣”等多個標注給NLP算法,按云測數(shù)據(jù)自己的說法,其培訓達到的目標,是讓標注員工達到成為專業(yè)員工的水準。
顯然,在NLP標注數(shù)據(jù)的初期階段將各大金融機構的AI客服機器人訓練到大致相當?shù)某跫壵J知智能水平后,再進行提升、提高銷售轉化或者服務滿意度,都需要質量更高、針對特定需求更強的NLP標注數(shù)據(jù)。
值得一提的是,在NLP領域不是所有標注都能通過人員培訓來解決,醫(yī)療、法律等過于專業(yè)的領域可能還是依賴專家標注(邀請醫(yī)生、律師等參與標注),那是一個更復雜的故事了。
4、工具使用,持續(xù)加碼“便捷化”
工欲善其事必先利其器,NLP的標注雖然不像CV有很多空間維度的數(shù)據(jù)需求,但工具提升便捷度進而提升標準效率和準確性的價值仍然不可小覷。
這方面,巨頭的腳步更早,在國外,Google Fluid Annotation一度是NLP標注“最好使”的工具,國內,大廠和專業(yè)平臺的工具也被廣泛使用,云測數(shù)據(jù)在工具上的創(chuàng)新優(yōu)勢很明顯。
總體而言,標注工具適合自己的才是最好的。這種根據(jù)定制化需求開發(fā)貼合實際需要的數(shù)據(jù)工具對場景化數(shù)據(jù)的生產(chǎn),發(fā)揮著重要作用。
無論如何,持續(xù)加碼“便捷化”,是一個不會停止的過程。
NLP數(shù)據(jù)產(chǎn)業(yè)的機會,將會是誰坐莊?
在AI領域,雖然有大廠走在前列,但市場并沒有被巨頭壟斷,中型AI平臺也常常嶄露頭角成為主角。以AI數(shù)據(jù)服務領域為例,像云測數(shù)據(jù)這種專注于企業(yè)服務的第三方獨立平臺,以客戶為中心的企業(yè)基因,一直貫穿在數(shù)據(jù)交付的始終。
一個典型的表現(xiàn)是,高精確度的NLP數(shù)據(jù)需要以企業(yè)服務的心態(tài)與客戶仔細對接需求,例如,用戶需求的場景是什么,如果是訂票,AI問答應該主要導向訂票,對應的NLP數(shù)據(jù)也要往這個方向去標注。
這一過程中需要數(shù)據(jù)服務人員對需求進行拆解、預判甚至提前給出建議,與客戶反復溝通確認達成一致后,才能真正地去作業(yè)。大廠偏重于技術架構、前沿技術開發(fā)、云服務器中心大規(guī)模并發(fā)能力等建設,很難俯下身好好完成這件事,這時候,AI數(shù)據(jù)專業(yè)化平臺更有優(yōu)勢。
此外,影響競爭格局走向的還有數(shù)據(jù)服務的安全性。
在數(shù)據(jù)采集與標注行業(yè),復制一份數(shù)據(jù)在技術上非常簡單,也能節(jié)省大量的人力和運營成本,但給客戶帶來的損失卻不小(尤其是被競爭對手拿到),保證數(shù)據(jù)隱私性和安全性,在AI激烈的競爭環(huán)境下幾乎成為某些客戶的首要決策標準。
總而言之,高專業(yè)度、高精準度、高效率、強安全才能贏得AI數(shù)據(jù)客戶尤其是NLP數(shù)據(jù)客戶的選擇,不論巨頭還是AI數(shù)據(jù)專業(yè)化平臺在行業(yè)爆發(fā)式增長的關口都在努力,落實和推進了諸多動作。NLP數(shù)據(jù)產(chǎn)業(yè)正處在藍海,一個不會由巨頭坐莊的藍海。

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀”爆發(fā)至今,五類新物種登上歷史舞臺
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計算迎來商業(yè)化突破,但落地仍需時間
- 7 東陽光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長空間
- 8 地平線自動駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關稅,能否乘機器人東風翻身?