你會多少?2015年獲得大數(shù)據(jù)頂尖職位必備的9項技能
在大數(shù)據(jù)商品化之前, 利用大數(shù)據(jù)分析工具和技術(shù)來取得競爭優(yōu)勢已不再是秘密。2015年, 如果你還在職場上尋找大數(shù)據(jù)的相關(guān)工作, 那么, 這里介紹的9種技能,將幫助你得到一個工作機會。
1. Apache Hadoop
Hadoop現(xiàn)在已經(jīng)進入第二個10年發(fā)展期了, 但不可否認的是, Hadoop在2014年出現(xiàn)了井噴式發(fā)展, 由于Hadoop從測試集群向生產(chǎn)和軟件供應商方向不斷轉(zhuǎn)移, 其越來越接近于分布式存儲和處理機架構(gòu), 因此, 這一勢頭在2015年會更加猛烈。由于大數(shù)據(jù)平臺的強大, Hadoop可能是一個挑剔的怪獸, 它需要熟悉的技術(shù)人員細心的照顧和喂養(yǎng)。掌握Hadoop最核心技術(shù) (例如, HDFS, MapReduce, Flume, Oozie, Hive, Pig, HBase, and YARN) 的技術(shù)人員在職場上的需求將越來越大。
2. Apache Spark
如果說Hadoop在大數(shù)據(jù)世界中已廣為人知, 那么Spark就是一匹黑馬, 它所蘊含的原始潛力使Hadoop黯然失色。無論是否是Hadoop架構(gòu), 快速崛起的內(nèi)存計算技術(shù)被認為是MapReduce風格分析框架更快和更簡潔的替代方案。Spark***的定位應當是大數(shù)據(jù)技術(shù)族中重要的一個成員。 Spark仍然需要專業(yè)技術(shù)進行編程和運行, 這為知曉該技術(shù)的工程師提供了不錯的工作機會。
3. NoSQL
在大數(shù)據(jù)的操作層面, 諸如 MongoDB 和 Couchbase 等分布式、可擴展的 NoSQL 數(shù)據(jù)庫正在接管市場份額極為龐大的的 SQL 數(shù)據(jù)庫, 例如 Oracle 和 IBM DB2。在 WEB 和移動 app 層面, NoSQL數(shù)據(jù)庫常常被做為 Hadoop分析的數(shù)據(jù)源。在大數(shù)據(jù)領(lǐng)域, Hadoop 和 NoSQL 分別成為良性循環(huán)的兩個端點。
4. Machine Learning and Data Mining(機器學習和數(shù)據(jù)挖掘)
人們習慣于對收集的數(shù)據(jù)進行挖掘,但是, 在當今大數(shù)據(jù)的世界里, 數(shù)據(jù)挖掘已經(jīng)達到了一個全新的高度。機器學習成為去年大數(shù)據(jù)技術(shù)最熱門的領(lǐng)域之一, 2015年順理成章地成為它的突破之年。大數(shù)據(jù)將會使那些能夠利用機器學習技術(shù)去構(gòu)建和訓練像分類、推薦和個性化系統(tǒng)等預測分析應用程序的人成為職場寵 兒, 取得就業(yè)市 場上的***薪金。
5. Statistical and Quantitative Analysis(統(tǒng)計和定量分析)
這就是大數(shù)據(jù)。如果你有定量推理背景和數(shù)學或統(tǒng)計學等方面的學位,那么你就成功了一半。此外,再加上一些使用統(tǒng)計工具經(jīng)驗,例如 R, SAS, Matlab, SPSS, 或者是 Stata, 你就能夠鎖定這些工作崗位啦。在過去,許多量化工程師都會選擇在華爾街工作, 但由于大數(shù)據(jù)的快速發(fā)展, 現(xiàn)在各行各樣都需要大量的具有定量分析背景的 極客。
6. SQL
以數(shù)據(jù)為中心的語言已有超過40年的歷史了, 但是這種祖父級的語言在當前的大數(shù)據(jù)時代仍然具有生命力。盡管它難以應對大數(shù)據(jù)的挑戰(zhàn) (見上文NoSQL部分), 但是, 簡化了的結(jié)構(gòu)化語言使其在許多方面變得十分容易。同時應該感謝來自于Cloudera所發(fā)布的Impala等開源項目, SQL獲得了新生, 成為下一代Hadoop規(guī)模的數(shù)據(jù)倉庫的通用語言。
7. Data Visualization(數(shù)據(jù)可視化)
大數(shù)據(jù)可能不是那么容易理解, 但在某些情況下, 通過鮮活的數(shù)據(jù)吸引眼球仍然是不可替代的方法。你可以一直采用多元或邏輯回歸分析方法解析數(shù)據(jù), 但是, 有時候使用類似 Tableau 或 Qlikview 這樣的可視化工具探索數(shù)據(jù)樣本能夠直觀的告訴你所擁有的數(shù)據(jù)的形態(tài), 甚至是發(fā)現(xiàn)那些能夠改變你處理數(shù)據(jù)方法的一些隱蔽細節(jié)。當然,如果你長大后想成為數(shù)據(jù)藝術(shù)家, 那么, 精通一個甚至是更多的可視化工具就是必不可少的了。
8. General Purpose Programming Languages
在類似 Java, C, Python, 或 Scala 等通用語言中擁有編程應用經(jīng)驗能夠使你相對于那些局限于分析技術(shù)的人更具有優(yōu)勢。根據(jù) Wanted Analytics的統(tǒng)計, 招聘具有數(shù)據(jù)分析背景的“計算機編程”職位的數(shù)量增長了 337%。具有傳統(tǒng)應用程序開發(fā)和新興數(shù)據(jù)分析能力的人將會有極大的就業(yè)選擇空間, 能夠自由的在終端用戶企業(yè)和大數(shù)據(jù)創(chuàng)業(yè)公司之間進行流動。
9. Creativity and Problem Solving(創(chuàng)造力和問題解決能力)
無論你在高級分析工具和技術(shù)方面有多大優(yōu)勢,自主思考能力仍然是無可替代 的。大數(shù)據(jù)處理工具會不可避免的進行演化發(fā)展,新技術(shù)會不斷涌現(xiàn)并替代這里所列 出的技術(shù)。但是,如果你能出于本能的渴求新的知識,并且能夠像獵犬一樣發(fā)現(xiàn)問題 的解決方案,就會有大量的工作機會在等著你。
本文翻譯自:9 Must-Have Skills to Land Top Big Data Jobs in 2015 by datanami (datanami 是著名的大數(shù)據(jù)網(wǎng)站)
作者:@善良的右行 from NLPJob翻譯小組


































