訂閱
糾錯(cuò)
加入自媒體

一覽群智胡健:先成為頭牌,再造AI軟件生態(tài)

落地場(chǎng)景與完全信息

采訪中,胡健向i黑馬&黑智講了一個(gè)場(chǎng)景落地的故事。這個(gè)場(chǎng)景是金融行業(yè)中的國(guó)際結(jié)算業(yè)務(wù)。

國(guó)際結(jié)算業(yè)務(wù)不是銀行的最核心的業(yè)務(wù),但是業(yè)務(wù)量大,每年有幾百億元的收入,而且痛點(diǎn)足夠痛,該業(yè)務(wù)要求審核人員看得懂英文,看得懂合同,是相關(guān)專業(yè)的碩士。銀行一年需要付給一位審核員20、30萬(wàn)的工資,而且還不一定可以留得住人。

于是,一覽群智便和某銀行一起打造該業(yè)務(wù)的解決方案。期間遇到了很多困難,比如幾萬(wàn)種不同格式的票據(jù),甚至還一些票據(jù)有遮擋,怎么樣將票據(jù)變成文本結(jié)構(gòu)化信息?這就牽涉到識(shí)別OCR、識(shí)別票據(jù)等。這需要對(duì)不同非結(jié)構(gòu)化數(shù)據(jù)做OCR。其次,識(shí)別完之后,需要抽取信息、分詞等。這個(gè)階段,一覽群智要給出各種字段,識(shí)別合同內(nèi)涵,比如這份合同講的是一件什么樣的事情?通過(guò)報(bào)關(guān)單上的“無(wú)破損”描述判定物品“外觀完好”等;第三,一覽群智還需要解決語(yǔ)義理解的問(wèn)題。其中還會(huì)牽涉到知識(shí)圖譜。別無(wú)捷徑,通過(guò)大量的數(shù)據(jù)讓機(jī)器學(xué)會(huì)具體的審核邏輯。

“邏輯很簡(jiǎn)單,像人做一些腦力勞動(dòng)的工作一樣,首先能夠看得懂是什么,將圖片變成文字,并將文字變成結(jié)構(gòu)化信息,再把結(jié)構(gòu)化信息跟專家業(yè)務(wù)產(chǎn)品銜接,這就是知識(shí)圖譜,最終去做決策,這是標(biāo)準(zhǔn)的認(rèn)知過(guò)程!边@個(gè)過(guò)程中,胡健提到針對(duì)不同行業(yè),構(gòu)建一個(gè)類似于專家的規(guī)則系統(tǒng),有一個(gè)與或非的邏輯!斑@個(gè)規(guī)則系統(tǒng)要被抽象得非常靈活。規(guī)則系統(tǒng)與知識(shí)圖譜結(jié)合的過(guò)程中,漸漸地被抽象成一套模具工廠;原來(lái)的知識(shí)圖譜只適用于單一的業(yè)務(wù)場(chǎng)景,當(dāng)它應(yīng)用于不同類型的場(chǎng)景,就被進(jìn)一步抽象。每抽象一下,能解決面臨的多場(chǎng)景或者多業(yè)務(wù)的問(wèn)題。但突然又來(lái)了十幾個(gè)不同場(chǎng)景,就會(huì)發(fā)現(xiàn)原來(lái)的知識(shí)圖譜或者規(guī)則系統(tǒng)還是有問(wèn)題,那就需要再次抽象。這就跟達(dá)爾文的進(jìn)化論一樣。適者生存,不斷進(jìn)化,滿足不同需求。如此,產(chǎn)品越來(lái)越好用!

如何沉淀專家經(jīng)驗(yàn)?如何構(gòu)建規(guī)則系統(tǒng)?以公安領(lǐng)域的反洗錢為例,一覽群智有著類似的實(shí)踐。一般反洗錢偵查中,警察會(huì)查一查大的進(jìn)出口資金的流向,設(shè)置一些規(guī)則,篩選出現(xiàn)金流出的TOP10的帳戶,并過(guò)濾掉正常帳戶,剩下幾個(gè)只進(jìn)不出的黑洞帳戶,或者進(jìn)出一致的通道帳戶。順藤摸瓜,就能找到背后的主使者。一覽群智將這些專家經(jīng)驗(yàn)配置到模型工廠里,把所有數(shù)據(jù)變成因子,變成與或非,或者決策分析的因子,然后拼出一個(gè)決策樹(shù)。一個(gè)決策樹(shù)就是一個(gè)經(jīng)驗(yàn)。規(guī)則系統(tǒng)的建立加上專家經(jīng)驗(yàn)輔助決策,才能夠產(chǎn)生化學(xué)反應(yīng),讓普通民警具備經(jīng)偵專家的能力。

據(jù)公開(kāi)資料介紹,一覽群智落地的領(lǐng)域除了金融行業(yè),還有公共安全和媒體情報(bào)。在這些領(lǐng)域,一覽群智有專門的專家團(tuán)隊(duì)解決行業(yè)know-h(huán)ow問(wèn)題。一覽群智的商業(yè)化戰(zhàn)略一直在碰撞中,“為什么人工智能落地難?因?yàn)橐粩嗯鲎。首先先用邏輯篩選一遍,這個(gè)邏輯是技術(shù)的邏輯,是商業(yè)的邏輯,也是與客戶業(yè)務(wù)相關(guān)的邏輯;其次,這些邏輯都符合,才有可能產(chǎn)生10個(gè)商業(yè)可能性。拿給客戶,被斃掉9個(gè),只剩下1個(gè),那就先做!

上述案例,有一個(gè)不可回避的前提是:目前人工智能的技術(shù)限制,F(xiàn)階段,人工智能只能解決一些偏重復(fù)式的工作。前面提到的國(guó)際結(jié)算業(yè)務(wù)便是偏重復(fù)式的、相對(duì)閉環(huán)的場(chǎng)景。在閉環(huán)場(chǎng)景里,一覽群智可以知道所有可能的情況。這和張鈸院士提到的人工智能落地的幾個(gè)經(jīng)濟(jì)中的完全性經(jīng)濟(jì)有相似之處。

而在公共安全領(lǐng)域落地的案例,與國(guó)際結(jié)算業(yè)務(wù)相比,與人機(jī)協(xié)同相關(guān),更加復(fù)雜。在一個(gè)大的任務(wù)里人的腦子有限、計(jì)算能力有限、存儲(chǔ)能力有限、加工處理能力有限,而機(jī)器可以做這些工作。胡健指出,所謂“機(jī)器”指的是“把一些大容量的數(shù)據(jù)全部整干凈”。機(jī)器弱點(diǎn)也是明顯的,它無(wú)法做出判斷。機(jī)器只能對(duì)一些已經(jīng)出現(xiàn)過(guò)的,并生成技能樹(shù)的相關(guān)情況,做出判斷。比如找出涉嫌洗錢的嫌疑人,但這不是最終判斷。人會(huì)看一下為什么會(huì)認(rèn)為他有嫌疑?機(jī)器的建議再加上人的經(jīng)驗(yàn)和知覺(jué),做出最終的判斷。人是有常識(shí)的,但機(jī)器不知道這些。這些常識(shí)需要長(zhǎng)年累月的積累。

“我們必須遵從人工智能現(xiàn)階段的技術(shù)發(fā)展特征,找到最適合的方式去落地!边@是一覽群智的落地思路!拔覀儽M量做一些確定性的、相對(duì)封閉的、完全信息的場(chǎng)景。而且這個(gè)場(chǎng)景的數(shù)據(jù)又是準(zhǔn)備好的,且解決完之后,又能夠產(chǎn)生商業(yè)價(jià)值,有諸多前提。層層限制之下,真正適合AI落地的領(lǐng)域并不多。沒(méi)辦法,圈了一下,就這么多。這也是AI公司扎堆落地的原因。”

聲明: 本文系OFweek根據(jù)授權(quán)轉(zhuǎn)載自其它媒體或授權(quán)刊載,目的在于信息傳遞,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),如有新聞稿件和圖片作品的內(nèi)容、版權(quán)以及其它問(wèn)題的,請(qǐng)聯(lián)系我們。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)