FacebookTwitterLineHatena

眼下資料科學家正夯,被哈佛商業評論稱為「21世紀最性感的職業」,Google、FB、Apple等大公司也爭相搶奪資料科學人才,並給出令人咋舌的薪資。性感的背後是人才的緊缺和人才培養的高難度。那麼成為一名資料科學家都需要些什麼,為什麼那麼困難呢?

首先,需要深入而廣泛的知識儲備。

這其中包括:

1、熟悉基本的編程語言。

資料科學家其實也是工程師,雖然不像前端工程師那樣編寫Web應用程序,但是需要負責架構資料處理管道,設計和實現模型,以及開發系統評估和度量計算的基礎架構。可以想像,執行這些任務需要使用高級編程語言(例如Python,R,Matlab或Julia)以及資料科學特定庫(例如Pandas,Scikit-learn,Matplotlib,或Tensorflow)。僅僅這一項技能可能就需要一年以上本科計算機科學學習。

2、數學知識。

資料科學家必須熟悉各種數學方面的知識,例如統計學,概率論和線性代數。通常在傳統的資料科學角色中,你需要能夠閱讀描述某些模型或資料集的學術論文,並利用和實現論文的關鍵思想,做到這點很不容易,因為數學領域的論文不是面向普通公眾的科普文,要弄懂它需要對數學概念和符號非常熟悉。這項技能比編程語言更加重要,它是資料科學家成為好的資料科學家之所在。

3、資料處理能力。

使用,理解和操縱資料與其他傳統工程工作完全不同。你可能經常看到未經過濾,不完整和稀疏的資料集,並期望從中獲得有意義的內容。這就要求你能夠輕鬆處理遇到的各種資料,比如:

如何補全缺失值?
如何處理/刪除異常值?
如何獲得更多均勻的標籤分佈來訓練我的模型?
哪種特徵與我的模型最相關?
如何檢測/處理模型過度擬合/欠擬合?
哪些指標對評估模型性能最有用?
“““

可以看到,要想成為一名資料科學家,需要了解的知識非常廣泛,而且每一門知識都需要深入研究學習而不是淺嘗輒止,這也是它為什麼入門門檻高的原因。但很多人都可以通過系統學習掌握這些知識技能,不一定非要進入頂尖的大學學習。

關於資料科學家需要掌握的知識,可以閱讀:

書單 | 從入門到精通,數據分析不得不看的10本「好書」!

10年數據老手建議:從入門到專家,如何規劃資料分析職涯

2018資料科學網路資源大推薦!線上課程&博客

其次,資料科學家不是一個基礎職位,需要大量的實踐。

很多人一上來就說怎麼樣才能成為一個資料科學家?要知道實際上這個職位並不是一個基礎性職位,你剛畢業或是剛剛讀完幾本資料分析的書就可以勝任的,理論知識只是第一步,是基礎的部分。接下來你還需要大量的實踐磨煉。在真實的工作環境中,遇到各種各樣的資料集,逐步去解決複雜問題,開發出實用的解決方案。

喜歡這篇文章嗎?歡迎分享按讚,給予我們支持和鼓勵!

熱門文章推薦

立即試用,可獲取更多 報表範本和案例

免費試用