日本搞逼视频_黄色一级片免费在线观看_色99久久_性明星video另类hd_欧美77_综合在线视频

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 互聯網 > 精英團隊PK全能型數據科學家,拼的可不只是數量

精英團隊PK全能型數據科學家,拼的可不只是數量

來源:程序員人生   發布時間:2014-09-29 08:00:00 閱讀次數:3387次

【編者按】作者Gil Press是Forbes的專欄作家, 本文他借用Kdnuggets網站的一次投票,為我們分析了大數據時代解決企業數據人才匱乏的方案。是要一個全能型的數據科學家?還是組建一個數據團隊?或者使用數據分析軟件?不同的人站在不同的角度肯定會有不同的看法,作者似乎更傾向于利用團隊的力量,一個由不同學科人才組成的管理完善的團隊也無疑是個很好的方案,看作者本人如何分析。


CSDN推薦:歡迎免費訂閱《Hadoop與大數據周刊》獲取更多Hadoop技術文獻、大數據技術分析、企業實戰經驗,生態圈發展趨勢。

以下為譯文:

Gregory Piatetsky最近在他頗受歡迎的Kdnuggets網站上進行了一次 民意調查,讓讀者們投票選擇在組織中建立數據科學能力的最優方法。這次投票是對Michael Mout 帖子有力地回應。Michael Mout勸說雇主不要招聘全能的“數據科學家”, 只聘用計算機科學家、統計學家和數據庫管理員,然后將他們組成一個數據科學團隊。


一位資深統計學家認為“數據科學”通常包含3個領域,這3個領域的技能、教育和訓練有很大不同,很少重疊。

Piatetsky的受訪者同樣被分成了勢力相當的兩派,一些人傾向于“尋找和培養具備所有(或大部分)所需技能的全能型數據科學家”,另一部分人則選擇“建立一個數據科學團隊,每個成員專注于某一項技能”。一些傾向于“個人”的受訪者考慮到資源有限的小公司。對于“個人”,更具實質性的爭論是:專家并不一定是全能的。


在任何專業領域做到全能都是難能可貴的,但如果指數據科學處理中所需技能的多樣性,特別是當你考慮Mont提到的那些附加技能,那這或許僅僅是一種才華的展現了。在 HBR博客上,Brad Brown和Brian Henstorf建議用“技術與數據專家”、“分析師與數據科學家”以及“業務分析與解決方案專家”組成一個數據科學團隊。同樣,Dawen Peng在 Think Operations Research博客上也列出了以下技能:業務咨詢、分析與建模、通信與可視化、數據工程,還有編程。

這個關于數據科學家的辯論:是具有多個技能和實踐經驗的全能型個人好,還是多學科團隊更優?這其實和被認可數據科學家的稀缺有關。我之所以強調是“被認可的”,是因為數據專家本身就是個模糊的概念,不可能估計出(即使對于數據科學家來說也一樣)數據專家的供需情況。

2011年McKinsey全球研究所對大數據的一份報告,經常被引用作為數據科學家不足的權威資料,實際上這份報道是關于美國面臨的“14萬到19萬具備深入分析技能人才的短缺”。即使你假設用具備“深入分析技能”(McKinsey把它定義為“在統計或機器學習方面接受高等教育的人”)來定義數據科學家(McKinsey沒有使用這個詞)已經足夠了,你應該把報告和相關的附錄完整地讀完,去了解McKinsey的定義和假設(例如“到2018年整個經濟領域的公司完全采用大數據技術”),還有基于假設得到供需不平衡的這種看似準確的預測。

McKinsey公司第一次公開對大數據綜合評估,試圖預測大數據在未來的重要潛力,這一點還是值得稱贊的,而且最重要的是,它用數字告訴我們大數據時代的到來。但對于數據科學家未充分利用和短缺問題沒有采取任何行動、不論在現在還是將來,這都是不爭的事實。

我申明我只是指出基于研究報告錯誤引用的炒作成為了“事實”(必須承認McKinsey的執行摘要可能有更詳細的內容而且更嚴謹,但我猜“執行”這兩個字換成“買方須知”也差不多吧)。我毫不懷疑在我們數據飽和的世界,對具有“深分析技能”人的需求,已經持續相當長的一段時間了,North Carolina州業務分析項目專業的就業成功率證明了這一點。這個特殊的項目――2012年的所有84個畢業生都找到了工作――這個項目成立于2007年,距離我們被告知大數據時代缺乏數據科學家還很早。不管過去的“深分析技能”從哪個教學計劃畢業――業務分析、運籌學、統計學,或任何其他學科(或工作經驗),都培養了他們的數據挖掘技能――他們都很快找到了工作,假如他們對數據分析工具(60年代發展起來的SAS和SPSS)有實際操作經驗的話,可能會更有優勢。

“數據科學家”,新的定義是“具有深入數據分析能力的人”――和供求失衡的事實相聯系――是由新的教育項目推動的,用供應商的新工具自動管理和挖掘不斷增長的數據,取代了“業務分析”和“數據科學”。供應商,尤其是那些注重精簡或使數據分析過程自動化的供應商,理所當然有興趣把個人vs.團隊的問題轉移到一個結論,那就是不管哪種方案都是不可行的,因為你找不到數據科學家,最好的辦法就是用工具使他們的工作或部分工作自動化。

這真是令人耳目一新,后來讀到了Joe Hellerstein(Trifacta的合伙人,Trifacta試圖使數據清洗、艱苦和枯燥的數據分析過程實現自動化),必須要談一下數據科學了:“任何承諾在數據分析領域實現自動化的人都陷入了毫無意義的自大。數據分析是一個過程,從根本上說是關于人的過程(能夠理解業務問題和有關數據之間聯系,建立假說并解釋最終的數字的人),不僅僅是技術。說到底,數據科學――像所有的科學一樣――是人類的創造性活動。拿走‘科學’,就只剩下‘數據’了。”

Hellerstein認為解決被他稱為“三重技能數據科學家”稀缺的辦法是利用人為分析協同工作的技術,使數據科學更有成效、適用面更廣。他同意將有不同技能的人組成團隊是一個“明智的辦法”,但很多組織以“成本太高”、“市場中精通某項技術的人也很少,沒有可行性”等理由將團隊解散,在捍衛對人才的需求的同時,他支持使用工具來實現自動化,至少簡化數據科學家的部分工作。

福特的數據科學家Caveretta很難同意這樣的觀點:“雖然有很多的供應商說,‘你不需要數據科學家,只要用我們的軟件就行了,’......要實現用軟件取代數據科學家,還需要很長時間。”他選擇團隊方案:“你不需要找這些“獨角獸”們,這些人很難找到,你還得付給他們難以置信數額的錢。你可以建立一個能完成數據分析的團隊,對我來說這已經足夠了,和我們引進數據科學家一樣,在公司內部建立數據分析團隊同樣具有戰略意義,用公司內部人才補充數據科學家這一空缺是個不錯的方案。”

大約五年前,Linkedin網站定義了數據科學家這一角色,DJ Patil也選擇 采取團隊辦法,但規模更大,團隊中還包括了與編程和統計無關的人:“我們的數據團隊不能只是由純粹的數學家和其他和數據相關的人組成,這一點很重要。它是一種完全集成的生產組,包括設計、web開發、管理、產品營銷和運維各個領域的人。他們都理解數據而且工作中也接觸到數據,我認為他們都是數據科學家。我們刻意模糊組織中不同的角色之間的界限。

在我看來,這正是團隊的力量,這也解釋了為什么要用團隊方案,即使是在我們有充足的數據科學家或“有深入分析能力的人”(不管怎么稱呼他們)的情況下。相比個人或同類型技能和經驗的人組成的團隊,由具有不同技能和經驗的成員組成的團隊有可能做出更好的決策。這不只是因為基于不同經驗和專業知識不同觀點有助于更好地了解不同情況和行動的潛在后果。管理良好的團隊鼓勵辯論,不同的觀點有助于減少或消除團隊成員的個人偏見。

這讓我想起了在之前的文章中討論過的McAfee定律:“隨著數據量的上漲,人為判斷的重要性應該下降。也許應該這么說:隨著數據量的上漲,管理完善、高度跨學科團隊的人為判斷比以往任何時候都更為重要。

原文鏈接: Big Data Debates: Individuals Vs. Teams(編譯/毛夢琪 審校/魏偉)

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 亚洲精品乱码久久久久久 | 日韩一区二区高清 | 日韩精品极品视频 | 亚洲专区欧美 | 精品一区二区三区免费 | 精品欧美一区二区三区免费观看 | 久久精品国产一区二区 | 一级毛片免费播放 | 欧美精品v国产精品v日韩精品 | 黄色免费网站 | 亚洲精品一区二区网址 | 日韩精品在线看 | 国产高清不卡av | 精品天堂 | 国产精品一区二区久久久 | 色综合一区二区三区 | 男人懂的网站 | 国产一区精品在线 | 国产一区福利 | 九九热国产精品视频 | 538国产精品视频一区二区 | 国产日韩精品视频 | 2019亚洲日韩新视频 | 最近免费观看电影大全在线观看 | 国产精品久久久久永久免费观看 | 日日夜夜精 | 美女黄色在线观看 | 国产精品美女久久久久久久网站 | 亚洲成人免费 | 国产精品又黄又爽又色 | 一区二区三区四区在线播放 | 91美女网站 | 日本aⅴ毛片成人实战推荐 黄色成人在线观看 | va在线观看| 精品国产青草久久久久96 | 亚洲视频在线视频 | 精品国产精品国产偷麻豆 | 色94色欧美sute亚洲线路一久 | 91精品国产乱码久久久久久久久 | 午夜精品美女久久久久av福利 | 亚洲欧美视频二区 |