數(shù)據(jù)科學(xué)家含金量最高的5個數(shù)據(jù)科學(xué)認證,先馬后看!
大數(shù)據(jù)文摘出品
來源:medium
編譯:李雷
盡管關(guān)于這個話題的文章不計其數(shù),但文本作者想要找尋那種為大部分數(shù)據(jù)科學(xué)家所用而又有特色的工具及其認證。這些認證有的是免費的,有的比較便宜,但都值得嘗試。
不過,這還是要取決于你在數(shù)據(jù)科學(xué)領(lǐng)域的關(guān)注重點和發(fā)展方向。在數(shù)據(jù)科學(xué)從業(yè)的道路上,每個人想要獲得證書的原因有很多;有的證書可能很直白,例如數(shù)據(jù)科學(xué)證書,有的可能沒那么直白,例如Python編程證書。隨著課堂教學(xué)的減少,在線學(xué)習的地位與日俱增,逐漸成為數(shù)據(jù)科學(xué)從業(yè)者的必備良品。過去,在線課程和認證總讓人覺得不靠譜,而如今,不光老板們越來越期待它們給企業(yè)帶來提升,你也可以向利用它們老板證明,無論處在什么職位,你都可以提高自己的技能。
作者擁有南方衛(wèi)理公會大學(xué)數(shù)據(jù)科學(xué)教育理學(xué)碩士學(xué)位,盡管這是通過線上獲得的,但沒有哪個雇主認為它會比普通的碩士要低級。同樣,當他在面試時拿出數(shù)據(jù)科學(xué)證書和其他通過非傳統(tǒng)教育形式(如網(wǎng)課)獲得的證書時,幾位招聘經(jīng)理也十分喜歡,并且給他們留下了深刻的印象。除了具有不同形式的學(xué)習經(jīng)驗,他還具備數(shù)據(jù)科學(xué)家的專業(yè)經(jīng)驗,而這正是雇主們所期待的。此外,作者對一些工具和平臺非常了解,這也給他的日常工作帶來很大的幫助。
在下文中,作者將介紹五個可以提升數(shù)據(jù)科學(xué)職業(yè)生涯的認證。
- TensorFlow
- SAS
- IBM Data Science — Python
- Tableau
- Google Machine Learning
- Summary
- References
TensorFlow
TensorFlow 是一個被數(shù)據(jù)科學(xué)家和機器學(xué)習工程師廣泛使用的開源機器學(xué)習框架,其中包含各種功能強大的代碼庫,可以協(xié)助機器學(xué)習模型的構(gòu)建過程。TensorFlow的典型使用場景包括:
- 神經(jīng)網(wǎng)絡(luò)
- 生成對抗網(wǎng)絡(luò)(GAN)
- 圖像分類
- 文本分類
- 回歸
- 提升樹
- 時間序列預(yù)測
- 等等
TensorFlow認證的名稱是:TensorFlow開發(fā)人員證書。
該框架包含計算機視覺(CV),卷積神經(jīng)網(wǎng)絡(luò)(CNN)和自然語言處理(NLP)等各種模型。因為認證考試費用為100美元(較貴),因此建議你去找老板報銷(說不定能成功呢)。如果你關(guān)注的是機器學(xué)習或深度學(xué)習,那么這個證書會很有用。證書本身不是一個教程,只是對你使用TensorFlow能力的認可。但是,作者建議通過Coursera平臺提供的TensorFlow in Practice系列課程來學(xué)習,因為它涵蓋了TensorFlow的所有內(nèi)容,并且還是免費的。只要你覺得100美元的考試費不貴,或者可以通過助學(xué)金計劃免除學(xué)費時,那么就去考吧。據(jù)說學(xué)習了該系列課程的人:
- 完成課程的人中有40%開啟了新的職業(yè)生涯
- 12%的人獲得升職加薪
如此看來,這個認證及相應(yīng)的證書可以很好地展示你的技能,同時在TensorFlow這個廣闊的平臺上證明了你的競爭力。
SAS
SAS可能是數(shù)據(jù)科學(xué)家最不常用的平臺。但是,這也可能變成你的優(yōu)勢,因為可以確定的說,你的SAS技能是真正獨一無二,與眾不同的。你能做的事,大多數(shù)數(shù)據(jù)科學(xué)家無法做到。與Python和R這些數(shù)據(jù)科學(xué)家和機器學(xué)習工程師都使用的編程語言不同,SAS是一種類似于統(tǒng)計信息專用的SQL語言。作者在讀數(shù)據(jù)科學(xué)碩士學(xué)位時,這個平臺是他接觸到的第一個數(shù)據(jù)科學(xué)學(xué)習平臺。
SAS的全稱是Statistical Analysis System。作為一個數(shù)據(jù)科學(xué)家,你在進行機器學(xué)習的時候可能會進入一種黑盒狀態(tài),無法得知機器到底是怎么學(xué)的。但是,如果你使用SAS,則會得到非常詳盡的統(tǒng)計信息。這在面試數(shù)據(jù)科學(xué)職位的時候特別有用,當招聘經(jīng)理向你詢問復(fù)雜的統(tǒng)計問題,只掌握Python數(shù)據(jù)科學(xué)庫是無法回答這些問題的。使用SAS的優(yōu)勢是可以使用Q-Q圖,直方圖和殘差圖等方法測試正態(tài)性,還可以執(zhí)行ANOVA和MANOVA(方差分析或方差多重分析)之類的測試。
這個證書的名稱是:SAS程序員專業(yè)證書。
這個認證在Coursera平臺上也有相應(yīng)的課程,可以免費注冊并且在完成課程后獲得收費證書。
請記住,即使這些是認證和課程可以免費,但考試或?qū)嵨镒C書通常還是要花錢的。不過你仍然可以免費地學(xué)習部分甚至全部課程,而且如果你的老板或者面試公司認可你對相關(guān)課程學(xué)習,那你也就無需付費考試或者購買證書了。
在該課程中你將學(xué)習SAS編程語言以及不同數(shù)據(jù)類型處理。這個證書及相關(guān)課程對職業(yè)發(fā)展有著極大的作用:
- 學(xué)習了這個系列課程的人中有21%開啟了新的職業(yè)生涯
- 50%的人獲得升職加薪
IBM數(shù)據(jù)科學(xué)證書-Python
前面的證書及課程側(cè)重于數(shù)據(jù)科學(xué)的特定方向,而這個證書涵蓋了整個通用數(shù)據(jù)科學(xué)體系。證書的名稱是:IBM數(shù)據(jù)科學(xué)專業(yè)證書。
與前面的證書類似,Coursera平臺上也有這個證書的相關(guān)課程。該證書的涵蓋面很廣,作者列出了所有的九門課程:
- 什么是數(shù)據(jù)科學(xué)?
- 數(shù)據(jù)科學(xué)工具(Jupyter Notebook,RStudio IDE等)
- 數(shù)據(jù)科學(xué)方法論(算力,部署等)
- Python與數(shù)據(jù)科學(xué)和AI(類型,變量,類模塊等)
- 數(shù)據(jù)科學(xué)中的的數(shù)據(jù)庫和SQL(結(jié)構(gòu)化查詢語言等)
- 使用Python進行數(shù)據(jù)分析(Pandas,Numpy和Scipy庫等)
- 使用Python進行數(shù)據(jù)可視化(Matplotlib,Seaborn等)
- 使用Python進行機器學(xué)習(分類,聚類等)
- 終極數(shù)據(jù)科學(xué)應(yīng)用(RESTful API調(diào)用,F(xiàn)olium等)
如上所述,該認證幾乎涵蓋了數(shù)據(jù)科學(xué)乃至機器學(xué)習的每個部分。根據(jù)你的目標和申請地點,本課程甚至可以完全替代學(xué)位,證據(jù)如下:
- 完成課程的人中46%開啟了新的職業(yè)生涯
- 19%的人升職加薪
多么令人驚嘆的數(shù)字,它將是你獲益最多的課程和認證之一。如果你想全面了解數(shù)據(jù)科學(xué),作者推薦本課程。大約有100萬人瀏覽了課程主頁,足見該課程的受歡迎程度之高。
Tableau
這個證書可能有些人會不同意,不過你還是應(yīng)該認真考慮一下。Tableau是描述指標和統(tǒng)計數(shù)據(jù)的可視化工具,因此可能更像是數(shù)據(jù)分析或商業(yè)智能方面的技能。但是,數(shù)據(jù)科學(xué)家掌握Tableau也有一些好處,包括:
- 模型攝取數(shù)據(jù)的可視化表示
- 探索性數(shù)據(jù)分析
- 變動和趨勢分析
- 令人印象深刻的可視化數(shù)據(jù)科學(xué)模型指標
通常,如果你是個數(shù)據(jù)科學(xué)家,你需要陳述你的發(fā)現(xiàn),那么Tableau是一個簡單易用的工具,可以幫助你描述模型狀態(tài)和指標,以便你的同僚可以每天查看數(shù)據(jù)業(yè)務(wù)問題的進展情況。
Tableau包含幾種認證,但重點介紹一個:Tableau Desktop專家。
該證書重點放在Tableau的基礎(chǔ)知識,這對于入門級別的你可能很重要。作為數(shù)據(jù)科學(xué)家,我們假設(shè)你已經(jīng)具備出色的問題解決能力,因此,一旦你掌握了Tableau基礎(chǔ)知識,就可以學(xué)習更復(fù)雜的功能。此項認證的費用為100美元,考試一共包含30道題目,時間60分鐘,包括多項選擇題,簡答題和實踐題,系統(tǒng)自動評分。Tableau還提供了幾門課程,可以幫助你更快地學(xué)習。
與其他的課程和證書更加專注于數(shù)據(jù)科學(xué)和機器學(xué)習相比,獲得這個證書可以讓你與眾不同,即如何使用Tableau來展示你的數(shù)據(jù)科學(xué)發(fā)現(xiàn)。
谷歌機器學(xué)習認證
最后一個認證(也許是最困難的)是來自谷歌。如果你是一名機器學(xué)習工程師,那么那你最好有這個證書。如果你是僅專注于模型的數(shù)據(jù)科學(xué)家,那么該證書也可以使你進一步進行部署和工程設(shè)計。這個認證將檢驗?zāi)銓σ韵轮饕獜?fù)雜概念的理解:
- 界定ML問題
- 開發(fā)ML模型
- 構(gòu)建ML解決方案
- 自動化和編排ML管道
- 準備和處理數(shù)據(jù)
- 監(jiān)控,優(yōu)化和維護ML解決方案
你可以選擇beta版認證,通過了即獲得Google Cloud認證,可以節(jié)省40%的費用,同時還可以獲得Google獨家定制服裝。這個證書的名稱是:專業(yè)機器學(xué)習工程師BETA。
考試的主要目標都是些非常有用的概念,每個考過的數(shù)據(jù)科學(xué)家或機器學(xué)習工程師最終都將受益匪淺。其中一些關(guān)鍵目標是:
- 通過將新業(yè)務(wù)挑戰(zhàn)轉(zhuǎn)化為ML用例來界定機器學(xué)習問題;
- 使用SDLC(軟件開發(fā)生命周期)最佳實踐來構(gòu)建ML解決方案架構(gòu);
- 通過設(shè)計數(shù)據(jù)管道進行數(shù)據(jù)準備和處理;
- ML模型開發(fā)與量產(chǎn)化;
- 帶有CI(持續(xù)集成)/ CD(持續(xù)交付)測試和部署的ML管道自動化和編排;
- 具有性能調(diào)優(yōu)和模型再訓(xùn)練標識的ML解決方案的監(jiān)控,優(yōu)化和維護。
由此可見,這個認證非常復(fù)雜,涵蓋了數(shù)據(jù)科學(xué)和機器學(xué)習的高難度核心領(lǐng)域。
總結(jié)
要成為一名優(yōu)秀的數(shù)據(jù)科學(xué)家,你并不需要讀完所有這些課程或考取全部證書,但這些認證都能以不同的方式給你帶來巨大的提升。以下是所有五個頂級認證的內(nèi)容及其各自的鏈接:
- TensorFlow開發(fā)人員認證:https://www.tensorflow.org/certificate
- SAS程序員專業(yè)證書:https://www.coursera.org/professional-certificates/sas-programming
- IBM數(shù)據(jù)科學(xué)專業(yè)證書:https://www.coursera.org/professional-certificates/ibm-data-science#courses
- Tableau Desktop專家:https://www.tableau.com/learn/certification/desktop-specialist
- 專業(yè)機器學(xué)習工程師BETA:https://cloud.google.com/certification/machine-learning-engineer
當然,數(shù)據(jù)科學(xué)還有更多其他的課程和證書。但是,對于你而言,最重要的事情是選擇這些證書(或其他類似證書)中的任何一個,并努力提高自己作為數(shù)據(jù)科學(xué)家的水平。想象一下,如果你獲得了這幾個認證中的任何一個,一定會讓你的老板眼前一亮(無論是現(xiàn)在和未來的)。這些證書不僅會讓你在面試時脫穎而出,而且最終還將幫助你在數(shù)據(jù)科學(xué)職業(yè)上走得更好。學(xué)習不止,考證不斷。
相關(guān)報道:https://towardsdatascience.com/the-top-5-data-science-certifications-71b3be907d8
【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】























