訂閱
糾錯(cuò)
加入自媒體

數(shù)據(jù)科學(xué)50年,數(shù)據(jù)科學(xué)家是否依然是21世紀(jì)最性感的職業(yè)?

2020-05-29 17:10
IT168
關(guān)注

在如今的數(shù)據(jù)智能時(shí)代,幾乎所有人都相信“數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼你只能看到冰山一角,而絕大部分則隱藏在表面之下。”當(dāng)數(shù)據(jù)的價(jià)值依然在冰山之下隱藏,外面的世界便彌漫著對(duì)數(shù)據(jù)的渴望。

一些新的職業(yè)成為數(shù)據(jù)海洋里的新星,“數(shù)據(jù)科學(xué)家”無(wú)疑是最亮的之一,它被譽(yù)為21世紀(jì)最性感的職業(yè),但是近年來(lái)隨著平民數(shù)據(jù)科學(xué)家的發(fā)展,有人指出數(shù)據(jù)科學(xué)家將要消失,也有國(guó)外相關(guān)人士建議不要去選數(shù)據(jù)科學(xué)家這個(gè)職業(yè),數(shù)據(jù)科學(xué)家還是21世紀(jì)最性感的職業(yè)嗎?

數(shù)據(jù)科學(xué)五十年仍是少年

數(shù)據(jù)科學(xué)家泛指數(shù)據(jù)科學(xué)的從業(yè)者,追溯數(shù)據(jù)科學(xué)家的源頭可以到數(shù)據(jù)科學(xué)誕生的1966年,當(dāng)時(shí)Peter Naur提出"數(shù)據(jù)科學(xué)"(“DataScience”起初叫"datalogy "),用來(lái)代替"計(jì)算機(jī)科學(xué)"。1996年,International Federation of Classification Societies (IFCS)國(guó)際會(huì)議召開(kāi)。數(shù)據(jù)科學(xué)一詞首次出現(xiàn)在會(huì)議(Data Science, classification, and related methods)標(biāo)題里。

在2000年代中期數(shù)據(jù)科學(xué)家職位開(kāi)始出現(xiàn),2009年Natahn Yau指出數(shù)據(jù)科學(xué)家是是采用科學(xué)方法、運(yùn)用數(shù)據(jù)挖掘工具尋找新的數(shù)據(jù)洞察的工程師,數(shù)據(jù)科學(xué)家集技術(shù)專家與數(shù)量分析師的角色于一身。

實(shí)際上大數(shù)據(jù)和數(shù)據(jù)科學(xué)在內(nèi)的整個(gè)數(shù)據(jù)行業(yè)最初都是由Google、Facebook、Twitter等互聯(lián)網(wǎng)巨頭驅(qū)動(dòng),現(xiàn)在仍然如此?偛课挥跉W洲的JetBrains是國(guó)際知名軟件開(kāi)發(fā)工具提供商,其產(chǎn)品經(jīng)理Andrey Cheptsov認(rèn)為互聯(lián)網(wǎng)巨頭能夠推動(dòng)數(shù)據(jù)行業(yè)的發(fā)展首先有所需求、并有能力進(jìn)行大規(guī)模有效處理數(shù)據(jù),其主要業(yè)務(wù)模型從核心上取決于自身處理大規(guī)模數(shù)據(jù)的效率。

隨著大數(shù)據(jù)行業(yè)的發(fā)展,數(shù)據(jù)科學(xué)家成為了職場(chǎng)新星,更是被財(cái)富雜志譽(yù)為21世紀(jì)最性感的職業(yè)。但是數(shù)據(jù)科學(xué)家在初期成長(zhǎng)也并非一帆風(fēng)順,根據(jù)商業(yè)智能公司SiSense在2012 年左右的一項(xiàng)報(bào)告,在接受調(diào)查的全球400位數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析人士中,59%的數(shù)據(jù)科學(xué)家在從業(yè)六年后都另謀高就。盡管該職業(yè)的報(bào)酬豐厚,其中超過(guò)半數(shù)表示對(duì)職業(yè)安全性的擔(dān)憂。

彼時(shí)麥肯錫等咨詢公司力挺數(shù)據(jù)科學(xué)家,堅(jiān)信數(shù)據(jù)科學(xué)家是當(dāng)今和未來(lái)稀缺的資源。隨著智能手機(jī)的普及移動(dòng)互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)價(jià)值越發(fā)凸顯,數(shù)據(jù)科學(xué)家水漲船高。LinkedIn 發(fā)布的《2017 年美國(guó)新興工作崗位報(bào)告》中指出,“自 2012 年以來(lái),數(shù)據(jù)科學(xué)家的職位增長(zhǎng)了 650% 以上”且“數(shù)百家企業(yè)都在招聘這些職位”。

國(guó)內(nèi)近幾年也有互聯(lián)網(wǎng)公司近幾年開(kāi)始逐步設(shè)立獨(dú)立的數(shù)據(jù)科學(xué)(DataScience)團(tuán)隊(duì),推動(dòng)公司向數(shù)據(jù)驅(qū)動(dòng)發(fā)展。進(jìn)入21世紀(jì)20年代,數(shù)據(jù)科學(xué)家成為更稀缺的資源,很多人也依然相信它還是21世紀(jì)最性感的職業(yè)。

不過(guò)榮譽(yù)傍身的新星也有“暗淡”的一面,2017年有研究指出數(shù)據(jù)科學(xué)家成為離職率最高的職位之一,通常他們每周都會(huì)花費(fèi)一定的時(shí)間尋找新工作。日前仍然有數(shù)據(jù)科學(xué)家從業(yè)者勸諫后來(lái)者不要入坑,可謂是冰火兩重天,何以至此?

數(shù)據(jù)科學(xué)五十年依舊是少年模樣,就如同“AI”這個(gè)名詞在1956年出現(xiàn)到如今60多年才有初步落地,數(shù)據(jù)科學(xué)是一個(gè)綜合性的學(xué)科,國(guó)內(nèi)外很多從業(yè)者認(rèn)為數(shù)據(jù)科學(xué)依然是探索性的工作,管理層對(duì) “數(shù)據(jù)科學(xué)” 的含義往往沒(méi)有達(dá)成共識(shí)。

雖然已經(jīng)經(jīng)過(guò)至少10多年的發(fā)展,現(xiàn)在可能受限于業(yè)務(wù),沒(méi)有辦法生搬硬套一個(gè)角色框架給數(shù)據(jù)科學(xué)家,企業(yè)也容易將數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師混淆。JetBrains產(chǎn)品經(jīng)理Maria Khalusova認(rèn)為“數(shù)據(jù)科學(xué)家”和“數(shù)據(jù)工程師”這兩種職位角色在行業(yè)中還是相當(dāng)新的,也正因此,通常沒(méi)有明確的職責(zé)劃分!拔覀兛吹皆谀承┕局杏蓴(shù)據(jù)科學(xué)家承擔(dān)的職責(zé),在其他公司中這些職責(zé)卻由數(shù)據(jù)工程師承擔(dān)。另一個(gè)越來(lái)越常見(jiàn)的新角色是機(jī)器學(xué)習(xí)工程師,但也是同樣的情況,他們也經(jīng)常與數(shù)據(jù)工程師發(fā)生重疊!盡aria Khalusova在接受IT168采訪時(shí)指出。

數(shù)據(jù)科學(xué)家VS數(shù)據(jù)工程師

新的技術(shù)融入產(chǎn)業(yè)和社會(huì)必然會(huì)帶來(lái)一場(chǎng)職業(yè)的辭舊迎新,這個(gè)過(guò)程并沒(méi)有那么快速。

“從技術(shù)角度來(lái)看,數(shù)據(jù)科學(xué)在某些情況下的實(shí)踐似乎還不如傳統(tǒng)軟件開(kāi)發(fā)成熟。企業(yè)可能會(huì)面臨以下挑戰(zhàn):建立可重現(xiàn)的機(jī)器學(xué)習(xí)管道,對(duì)數(shù)據(jù)和模型進(jìn)行版本控制以進(jìn)行審核,與快速發(fā)展的技術(shù)保持同步。”Maria Khalusova指出。

數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的角色兩者有許多共同的特點(diǎn)和共技能。這些重疊的技能包括處理和操作大數(shù)據(jù)集、應(yīng)用數(shù)據(jù)的編程技能、數(shù)據(jù)分析技能以及對(duì)系統(tǒng)操作的總體熟練程度。不過(guò)兩者還是有很大的不同。在筆者之前翻譯的文章中也強(qiáng)調(diào)了數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師不可能合二為一,為了從數(shù)據(jù)中獲得價(jià)值,大多數(shù)企業(yè)組織都需要數(shù)據(jù)科學(xué)和數(shù)據(jù)工程,由于相關(guān)技能有很大差異,二者合體也不太現(xiàn)實(shí)。企業(yè)組織可能需要多個(gè)數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師,但兩者之間的比例很少是1:1。對(duì)于大多數(shù)企業(yè)組織來(lái)說(shuō),擁有更多的數(shù)據(jù)工程師比數(shù)據(jù)科學(xué)家更有意義。因?yàn)閿?shù)據(jù)科學(xué)家已經(jīng)學(xué)會(huì)處理大量的干凈數(shù)據(jù),但是從許多不同系統(tǒng)獲得大量的干凈數(shù)據(jù)更難也更具挑戰(zhàn)。與抽象數(shù)據(jù)模型和對(duì)數(shù)據(jù)集運(yùn)行分析相比,移動(dòng)和清理數(shù)據(jù)的工作量更大。

從技能需求方面也有很大的差異,Maria Khalusova認(rèn)為,廣義上來(lái)講,數(shù)據(jù)工程師通常必須熟悉那些為分布式數(shù)據(jù)處理而設(shè)計(jì)的工具,例如Apache Spark、Apache Hadoop、Apache Ignite等。他們要具備數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖方面的經(jīng)驗(yàn),因?yàn)樗麄冃枰軌蚴炀毜厥褂肑ava、Scala和Kotlin等JVM語(yǔ)言,并且必須能夠創(chuàng)建和維護(hù)大多數(shù)數(shù)據(jù)基礎(chǔ)架構(gòu)。

1  2  下一頁(yè)>  
聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)