數(shù)據(jù)科學(xué)50年,數(shù)據(jù)科學(xué)家是否依然是21世紀(jì)最性感的職業(yè)?
在如今的數(shù)據(jù)智能時(shí)代,幾乎所有人都相信“數(shù)據(jù)的真實(shí)價(jià)值就像漂浮在海洋中的冰山,第一眼你只能看到冰山一角,而絕大部分則隱藏在表面之下。”當(dāng)數(shù)據(jù)的價(jià)值依然在冰山之下隱藏,外面的世界便彌漫著對(duì)數(shù)據(jù)的渴望。
一些新的職業(yè)成為數(shù)據(jù)海洋里的新星,“數(shù)據(jù)科學(xué)家”無(wú)疑是最亮的之一,它被譽(yù)為21世紀(jì)最性感的職業(yè),但是近年來(lái)隨著平民數(shù)據(jù)科學(xué)家的發(fā)展,有人指出數(shù)據(jù)科學(xué)家將要消失,也有國(guó)外相關(guān)人士建議不要去選數(shù)據(jù)科學(xué)家這個(gè)職業(yè),數(shù)據(jù)科學(xué)家還是21世紀(jì)最性感的職業(yè)嗎?
數(shù)據(jù)科學(xué)五十年仍是少年
數(shù)據(jù)科學(xué)家泛指數(shù)據(jù)科學(xué)的從業(yè)者,追溯數(shù)據(jù)科學(xué)家的源頭可以到數(shù)據(jù)科學(xué)誕生的1966年,當(dāng)時(shí)Peter Naur提出"數(shù)據(jù)科學(xué)"(“DataScience”起初叫"datalogy "),用來(lái)代替"計(jì)算機(jī)科學(xué)"。1996年,International Federation of Classification Societies (IFCS)國(guó)際會(huì)議召開(kāi)。數(shù)據(jù)科學(xué)一詞首次出現(xiàn)在會(huì)議(Data Science, classification, and related methods)標(biāo)題里。
在2000年代中期數(shù)據(jù)科學(xué)家職位開(kāi)始出現(xiàn),2009年Natahn Yau指出數(shù)據(jù)科學(xué)家是是采用科學(xué)方法、運(yùn)用數(shù)據(jù)挖掘工具尋找新的數(shù)據(jù)洞察的工程師,數(shù)據(jù)科學(xué)家集技術(shù)專家與數(shù)量分析師的角色于一身。
實(shí)際上大數(shù)據(jù)和數(shù)據(jù)科學(xué)在內(nèi)的整個(gè)數(shù)據(jù)行業(yè)最初都是由Google、Facebook、Twitter等互聯(lián)網(wǎng)巨頭驅(qū)動(dòng),現(xiàn)在仍然如此?偛课挥跉W洲的JetBrains是國(guó)際知名軟件開(kāi)發(fā)工具提供商,其產(chǎn)品經(jīng)理Andrey Cheptsov認(rèn)為互聯(lián)網(wǎng)巨頭能夠推動(dòng)數(shù)據(jù)行業(yè)的發(fā)展首先有所需求、并有能力進(jìn)行大規(guī)模有效處理數(shù)據(jù),其主要業(yè)務(wù)模型從核心上取決于自身處理大規(guī)模數(shù)據(jù)的效率。
隨著大數(shù)據(jù)行業(yè)的發(fā)展,數(shù)據(jù)科學(xué)家成為了職場(chǎng)新星,更是被財(cái)富雜志譽(yù)為21世紀(jì)最性感的職業(yè)。但是數(shù)據(jù)科學(xué)家在初期成長(zhǎng)也并非一帆風(fēng)順,根據(jù)商業(yè)智能公司SiSense在2012 年左右的一項(xiàng)報(bào)告,在接受調(diào)查的全球400位數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析人士中,59%的數(shù)據(jù)科學(xué)家在從業(yè)六年后都另謀高就。盡管該職業(yè)的報(bào)酬豐厚,其中超過(guò)半數(shù)表示對(duì)職業(yè)安全性的擔(dān)憂。
彼時(shí)麥肯錫等咨詢公司力挺數(shù)據(jù)科學(xué)家,堅(jiān)信數(shù)據(jù)科學(xué)家是當(dāng)今和未來(lái)稀缺的資源。隨著智能手機(jī)的普及移動(dòng)互聯(lián)網(wǎng)的發(fā)展,數(shù)據(jù)價(jià)值越發(fā)凸顯,數(shù)據(jù)科學(xué)家水漲船高。LinkedIn 發(fā)布的《2017 年美國(guó)新興工作崗位報(bào)告》中指出,“自 2012 年以來(lái),數(shù)據(jù)科學(xué)家的職位增長(zhǎng)了 650% 以上”且“數(shù)百家企業(yè)都在招聘這些職位”。
國(guó)內(nèi)近幾年也有互聯(lián)網(wǎng)公司近幾年開(kāi)始逐步設(shè)立獨(dú)立的數(shù)據(jù)科學(xué)(DataScience)團(tuán)隊(duì),推動(dòng)公司向數(shù)據(jù)驅(qū)動(dòng)發(fā)展。進(jìn)入21世紀(jì)20年代,數(shù)據(jù)科學(xué)家成為更稀缺的資源,很多人也依然相信它還是21世紀(jì)最性感的職業(yè)。
不過(guò)榮譽(yù)傍身的新星也有“暗淡”的一面,2017年有研究指出數(shù)據(jù)科學(xué)家成為離職率最高的職位之一,通常他們每周都會(huì)花費(fèi)一定的時(shí)間尋找新工作。日前仍然有數(shù)據(jù)科學(xué)家從業(yè)者勸諫后來(lái)者不要入坑,可謂是冰火兩重天,何以至此?
數(shù)據(jù)科學(xué)五十年依舊是少年模樣,就如同“AI”這個(gè)名詞在1956年出現(xiàn)到如今60多年才有初步落地,數(shù)據(jù)科學(xué)是一個(gè)綜合性的學(xué)科,國(guó)內(nèi)外很多從業(yè)者認(rèn)為數(shù)據(jù)科學(xué)依然是探索性的工作,管理層對(duì) “數(shù)據(jù)科學(xué)” 的含義往往沒(méi)有達(dá)成共識(shí)。
雖然已經(jīng)經(jīng)過(guò)至少10多年的發(fā)展,現(xiàn)在可能受限于業(yè)務(wù),沒(méi)有辦法生搬硬套一個(gè)角色框架給數(shù)據(jù)科學(xué)家,企業(yè)也容易將數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師混淆。JetBrains產(chǎn)品經(jīng)理Maria Khalusova認(rèn)為“數(shù)據(jù)科學(xué)家”和“數(shù)據(jù)工程師”這兩種職位角色在行業(yè)中還是相當(dāng)新的,也正因此,通常沒(méi)有明確的職責(zé)劃分!拔覀兛吹皆谀承┕局杏蓴(shù)據(jù)科學(xué)家承擔(dān)的職責(zé),在其他公司中這些職責(zé)卻由數(shù)據(jù)工程師承擔(dān)。另一個(gè)越來(lái)越常見(jiàn)的新角色是機(jī)器學(xué)習(xí)工程師,但也是同樣的情況,他們也經(jīng)常與數(shù)據(jù)工程師發(fā)生重疊!盡aria Khalusova在接受IT168采訪時(shí)指出。
數(shù)據(jù)科學(xué)家VS數(shù)據(jù)工程師
新的技術(shù)融入產(chǎn)業(yè)和社會(huì)必然會(huì)帶來(lái)一場(chǎng)職業(yè)的辭舊迎新,這個(gè)過(guò)程并沒(méi)有那么快速。
“從技術(shù)角度來(lái)看,數(shù)據(jù)科學(xué)在某些情況下的實(shí)踐似乎還不如傳統(tǒng)軟件開(kāi)發(fā)成熟。企業(yè)可能會(huì)面臨以下挑戰(zhàn):建立可重現(xiàn)的機(jī)器學(xué)習(xí)管道,對(duì)數(shù)據(jù)和模型進(jìn)行版本控制以進(jìn)行審核,與快速發(fā)展的技術(shù)保持同步。”Maria Khalusova指出。
數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師的角色兩者有許多共同的特點(diǎn)和共技能。這些重疊的技能包括處理和操作大數(shù)據(jù)集、應(yīng)用數(shù)據(jù)的編程技能、數(shù)據(jù)分析技能以及對(duì)系統(tǒng)操作的總體熟練程度。不過(guò)兩者還是有很大的不同。在筆者之前翻譯的文章中也強(qiáng)調(diào)了數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師不可能合二為一,為了從數(shù)據(jù)中獲得價(jià)值,大多數(shù)企業(yè)組織都需要數(shù)據(jù)科學(xué)和數(shù)據(jù)工程,由于相關(guān)技能有很大差異,二者合體也不太現(xiàn)實(shí)。企業(yè)組織可能需要多個(gè)數(shù)據(jù)科學(xué)家和數(shù)據(jù)工程師,但兩者之間的比例很少是1:1。對(duì)于大多數(shù)企業(yè)組織來(lái)說(shuō),擁有更多的數(shù)據(jù)工程師比數(shù)據(jù)科學(xué)家更有意義。因?yàn)閿?shù)據(jù)科學(xué)家已經(jīng)學(xué)會(huì)處理大量的干凈數(shù)據(jù),但是從許多不同系統(tǒng)獲得大量的干凈數(shù)據(jù)更難也更具挑戰(zhàn)。與抽象數(shù)據(jù)模型和對(duì)數(shù)據(jù)集運(yùn)行分析相比,移動(dòng)和清理數(shù)據(jù)的工作量更大。
從技能需求方面也有很大的差異,Maria Khalusova認(rèn)為,廣義上來(lái)講,數(shù)據(jù)工程師通常必須熟悉那些為分布式數(shù)據(jù)處理而設(shè)計(jì)的工具,例如Apache Spark、Apache Hadoop、Apache Ignite等。他們要具備數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖方面的經(jīng)驗(yàn),因?yàn)樗麄冃枰軌蚴炀毜厥褂肑ava、Scala和Kotlin等JVM語(yǔ)言,并且必須能夠創(chuàng)建和維護(hù)大多數(shù)數(shù)據(jù)基礎(chǔ)架構(gòu)。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車(chē)電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車(chē)】汽車(chē)E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書(shū)】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開(kāi)始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 “AI寒武紀(jì)”爆發(fā)至今,五類(lèi)新物種登上歷史舞臺(tái)
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開(kāi)成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?