国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

一篇文章看懂大數(shù)據(jù)分析就業(yè)前景及職能定位

大數(shù)據(jù)
今天主要給大家好好說說python的發(fā)展方向,但是一篇可能不夠,因?yàn)槲蚁氡M可能的給大家剖析行業(yè)情況,讓大家在做選擇的時(shí)候不至于還不知道這是干啥的,只知道這個(gè)很火。今天就先給大家講大數(shù)據(jù)分析工程師。

[[264446]]

Overview:

  • 基本概念
  • DS的職能要求
  • DE的職能要求
  • 總結(jié)

好了,就解釋到這里了,今天主要給大家好好說說python的發(fā)展方向,這篇文章也是藏了好久了,群里各種問怎么學(xué),大數(shù)據(jù)分析怎么學(xué),爬蟲怎么入門,說實(shí)在的,你關(guān)注我號(hào)久一點(diǎn),都知道有那么幾篇文章是專門給入門看的,還有幾篇是資料總結(jié)的。會(huì)找的都能找到。

但是一篇可能不夠,因?yàn)槲蚁氡M可能的給大家剖析行業(yè)情況,讓大家在做選擇的時(shí)候不至于還不知道這是干啥的,只知道這個(gè)很火。

今天就先給大家講大數(shù)據(jù)分析工程師。

一、基本概念

對(duì)于一大部分想轉(zhuǎn)行做IT,做python的,都是沖著大數(shù)據(jù)分析來的,那你知道大數(shù)據(jù)分析的是啥嗎?你知道大數(shù)據(jù)分析的崗位職能分配情況嗎?

如果這些都答不上來的話,那就別追風(fēng)口,如果盲目的跟風(fēng),只會(huì)讓你進(jìn)來找不著北,到頭來,浪費(fèi)1年時(shí)間,還的回去干老本行。

首先,我們經(jīng)常叫的大數(shù)據(jù)分析師有兩種崗位定位:

  • 大數(shù)據(jù)科學(xué)家,Data Scientist,DS
  • 大數(shù)據(jù)工程師,Data Engineer,DE

從這兩個(gè)單詞里,你就能看出端倪了,那接下來就以我在普華永道的工作經(jīng)歷告訴你,這兩者的區(qū)別,以及工作內(nèi)容劃分。

二、DS職能要求

1. 專業(yè)知識(shí)

DS的職能是算法分析,是基于對(duì)行業(yè)背景的了解幫助客戶作出預(yù)期計(jì)算。而這里面就會(huì)涉及到很多專業(yè)知識(shí),俗稱統(tǒng)計(jì)分析。

和pwc同事共事的時(shí)候,我經(jīng)常向他們討教關(guān)于DS的一些事情,再加上一起做項(xiàng)目,分工明確,也自然對(duì)DS更了解一些。我見過的DS都是碩士畢業(yè),還都是全美***0的學(xué)校,要么博士。

不是學(xué)歷歧視,是你要做這事情,就得要這點(diǎn)本事,你沒有7年,你的專業(yè)知識(shí)支撐不了你做DS。如果你不理解這句話,我給大家舉個(gè)例子:

大家都讀過小學(xué)(就怕我說都讀過高中,你說你初中畢業(yè)為了生存,就出來打拼了)不考慮天才好么,我們都是小老百姓。然后解題思路就是按照老師教的,而思路只局限在一元二次方程組,二元一次方程組,而讀過大學(xué)的,他可能直接用積分就給你解出來了;幾何題都做過對(duì)么,幾何題難的是什么?做輔助線啊!輔助線出來,人人都是華羅庚,還喜歡后面跟一句,我要是畫出來了,我也會(huì)做。

這是什么?就是知識(shí)邊界啊。你所知道的星辰大海,只是別人的滄海一粟。所以專業(yè)知識(shí)必不可少。

2. 行業(yè)背景

接下來DS還需要有某個(gè)領(lǐng)域的行業(yè)背景,俗稱BK,background knowledge。你可能會(huì)奇怪為什么還要這。

因?yàn)榇髷?shù)據(jù)分析都是針對(duì)行業(yè)來做的,那么行業(yè)內(nèi)的行話,套路,潛規(guī)則,生存法則都是不一樣的,你要對(duì)公司做預(yù)期分析,你就得對(duì)行業(yè)有一個(gè)基本認(rèn)識(shí),甚至深入了解。

我們以前的DS,貫穿各大實(shí)體行業(yè),有保險(xiǎn)的,醫(yī)療的,建筑的,心理的,法律的等等。為什么要招那么多DS,就是因?yàn)槊總€(gè)DS都有自己擅長的幾個(gè)領(lǐng)域。一定的BK能夠幫助DS在面對(duì)數(shù)據(jù)的時(shí)候快速的作出信息過濾,能夠在聊需求的時(shí)候,快速給出反饋。這才是價(jià)值。

3. 工具

到了第三塊,才是你們關(guān)心的python,為什么把python放***?因?yàn)閜ython只是一個(gè)工具。對(duì)于開發(fā)者來說,python可能是你們的底,但對(duì)于DS來說,python只是一個(gè)交通工具。

以前用excel VB,后來用java,現(xiàn)在還有人在用R,不過更多的還是python。這就好比說,現(xiàn)在如果你想去某個(gè)地方,坐地鐵能到的,基本都坐地鐵,因?yàn)橛挚煊址奖恪D菦]有地鐵的時(shí)候呢?只能做公交。沒有公交的時(shí)候呢?就得騎自行車,或者走路。

所以DS從來不會(huì)關(guān)心代碼運(yùn)行效率,他們關(guān)心的是編碼效率。而python正好又是編碼效率極高的。

所以你要和我說你在外面培訓(xùn)了4個(gè)月的大數(shù)據(jù)分析后,就想做DS了,那請(qǐng)你再考慮考慮。

三、DE職能要求

相對(duì)DS,DE就比較雜了,做的事情也多。就拿我來說,當(dāng)時(shí)中國data team 就3個(gè),2個(gè)DS,你說我是DE也可以,說我是打雜的也可以。因?yàn)镈S只負(fù)責(zé)算法輸出,而其余的都是我來做。

你們想想,一個(gè)項(xiàng)目光有算法能行嗎?誰去執(zhí)行它,它要如何被外部調(diào)用?臟數(shù)據(jù)的清洗工作誰來做?還有很多很多的事情需要你考慮。

那我一個(gè)個(gè)來說,首先DE最重要的事情就是輔助DS清洗數(shù)據(jù),我們叫data cleaning。因?yàn)楹芏鄷r(shí)候從外部拿到的數(shù)據(jù),無論是買來的,爬來的,還是已有的,都是原始數(shù)據(jù),DS需要對(duì)這部分?jǐn)?shù)據(jù)做一個(gè)預(yù)處理,否則很容易污染樣本數(shù)據(jù)。那DE的工作,很重要的一部分就是去清洗數(shù)據(jù)。至于規(guī)則是你和DS討論的,沒有一個(gè)固定的模版。

其次,剛剛說到的數(shù)據(jù)來源,有一個(gè)是爬來的,所以你還得會(huì)爬蟲。關(guān)于爬蟲部分的內(nèi)容我會(huì)另起一篇,給大家好好講講。當(dāng)時(shí)我想做,但沒有做的一部分就是爬蟲,因?yàn)槿烙泻芏喙_數(shù)據(jù)是可以去獲取的,當(dāng)時(shí)我想做的是分類,包括清洗、過濾、入庫、展示。沒來得及做。

如果你會(huì)爬蟲,DS就會(huì)很高興了,因?yàn)樗麄儾挥脼闆]有數(shù)據(jù)犯愁了,你要知道,對(duì)于DS來說,數(shù)據(jù)的數(shù)量和質(zhì)量都是他們關(guān)心的東西。而老板更是了,因?yàn)镈S要數(shù)據(jù),他就要花錢去買,如果你是DE你說你可以嘗試爬爬看,那老板對(duì)你什么看法?

那你如果還會(huì)做后端開發(fā)就更好了,我當(dāng)然的主要經(jīng)歷就放在了自動(dòng)化建設(shè)上面。US那邊的老板是沒有要求做,那我是本著提升生產(chǎn)效率去的,所以是自己給自己加戲了。***的效果還不錯(cuò),讓我一個(gè)任務(wù)從一周到1-2分鐘,只需要改配置就可以了,當(dāng)然這個(gè)過程是非常痛苦的,我們前前后后一起對(duì)需求,review代碼。

然后服務(wù)端寫好了,我們還可以做前端展示,對(duì)于vendor來說,他們不關(guān)心數(shù)據(jù)怎么來的,他們想看直接的東西,那不就是dashboard嗎?這塊我也沒做,只是開了個(gè)頭。

后來發(fā)現(xiàn)我們有一個(gè)20人的app團(tuán)隊(duì)在做這個(gè)事情,我肯定沒有人家20個(gè)人做得好,但是起碼在他們交付前,我們data team也可以體現(xiàn)出價(jià)值來不是?否則只有等app team做完了,把我們的數(shù)據(jù)接入了,老板在看的到。

所以我一直強(qiáng)調(diào),價(jià)值是自我實(shí)現(xiàn)的,平臺(tái)給你的是機(jī)會(huì),能做多大,都看你自己。前幾天還和一個(gè)讀者說這個(gè)事情,我說別和我扯公司規(guī)范,流程,在我看來都是借口。

你做運(yùn)維,一定要等測(cè)試代碼過了給到你,才能發(fā)布,那你為什么不能把測(cè)試之后的步驟自動(dòng)化?讓測(cè)試自己提交jira,然后打鉤子,做CI/CD?部署服務(wù)器,和我說測(cè)試服務(wù)器就要手搭,搭好了之后有一套腳本會(huì)自動(dòng)化部署其他服務(wù),那為什么不把創(chuàng)建服務(wù)器也自動(dòng)化?你又不是物理機(jī),你是云服務(wù)器啊。

題外話了,我們收回來,所以對(duì)于DE來說,做的事情可以很多。那python就是我們的武器庫了,武器是爬蟲、數(shù)據(jù)清洗、后端、前端等等,要什么拿什么,就看你有多少了。而武器庫里還可以加上kettle、tableau、informatica等等,這些只是附加項(xiàng)了。

這個(gè),培訓(xùn)機(jī)構(gòu)4個(gè)月培訓(xùn)一個(gè)武器,我是相信的。而他們鼓吹的大數(shù)據(jù)分析師,其實(shí)就是DE。不能說絕對(duì),只能說大部分把,給自己留條路……

四、總結(jié)

好了,今天說了那么多,希望能給正在大數(shù)據(jù)分析路上的你,吃一顆定心丸,該走的路一步不能少。

責(zé)任編輯:未麗燕 來源: 簡說Python
相關(guān)推薦

2020-04-22 13:27:20

數(shù)據(jù)分析模塊解決

2024-06-25 08:18:55

2021-04-09 08:40:51

網(wǎng)絡(luò)保險(xiǎn)網(wǎng)絡(luò)安全網(wǎng)絡(luò)風(fēng)險(xiǎn)

2019-04-17 15:16:00

Sparkshuffle算法

2014-08-08 15:22:20

2015-11-12 10:40:43

2021-10-28 10:18:01

數(shù)據(jù)分析矩陣分析法大數(shù)據(jù)

2020-04-14 20:40:58

Git內(nèi)部存儲(chǔ)

2021-04-07 06:11:37

Css前端CSS定位知識(shí)

2017-05-23 09:20:32

大數(shù)據(jù)數(shù)據(jù)分析多層模型

2018-08-23 16:22:40

2017-01-20 15:01:19

2020-10-09 08:15:11

JsBridge

2020-04-15 16:34:48

大數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)

2015-07-29 14:10:01

互聯(lián)網(wǎng)運(yùn)作模式

2017-11-06 10:17:41

CIO信息化安全

2018-12-26 10:14:56

綜合布線系統(tǒng)數(shù)據(jù)

2018-01-09 20:35:11

Swift編程語言

2023-01-05 07:52:36

高可用架構(gòu)消息隊(duì)列

2022-02-21 09:44:45

Git開源分布式
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩三级在线免费观看| 日本国产高清不卡| 在线视频三级| 91丨国产丨九色丨pron| 在线视频一区观看| 蜜乳av另类精品一区二区| 91亚色免费| 日韩国产在线| 国产精品久久久久久久久久小说| 视频二区欧美| 久久精品亚洲国产| 九九久久国产| 日韩中文字幕在线| 激情久久一区二区| 色妞一区二区三区| 日韩精品麻豆| 日韩亚洲成人av在线| 中文字幕成在线观看| 日韩欧美一级二级三级久久久| 欧美性孕妇孕交| 午夜一区二区三区视频| 在线观看h网址| 国产喂奶挤奶一区二区三区| 日本wwww视频| 国产精品国产三级国产a| 成人毛片免费在线观看| 亚洲视频狠狠干| a天堂中文在线官网| 亚洲va天堂va国产va久| 人人超碰在线| 在线观看区一区二| 国产二区三区在线| 91精品国产综合久久福利| 天天干在线视频论坛| 亚洲男人天堂九九视频| 高清久久精品| 热久久美女精品天天吊色| 天天揉久久久久亚洲精品| 国产精品区一区| 久久av老司机精品网站导航| 被灌满精子的波多野结衣| 欧美激情中文字幕一区二区| 久久精品xxx| 2017欧美狠狠色| 精产国产伦理一二三区| 欧美体内谢she精2性欧美| 一本一道波多野毛片中文在线 | 免费在线一级视频| 欧美性xxxxxxxx| 高清电影在线免费观看| 日韩中文字幕在线看| 久久久久久久久久久久久久久久久久久久 | 国产老熟妇精品观看| 国产欧美日韩一区二区三区在线观看 | 日韩欧美久久久| 激情久久一区二区| 国产成人亚洲综合91| 免费永久网站黄欧美| 日本www在线视频| 亚洲电影第三页| 7777kkk亚洲综合欧美网站| 欧美激情性做爰免费视频| 午夜久久影院| 久久精品视频16| 精品久久久一区| av免费不卡| 欧美激情久久久久| 亚洲精品乱码| 美女一区二区三区视频| 欧美精品1区2区3区| 91精品啪在线观看国产爱臀| 久久一区二区三区av| 国产色一区二区| 日本中文字幕在线2020| 欧美久久久精品| 亚洲日本黄色| 性刺激的欧美三级视频| 日韩欧美色综合网站| 国产成人一二| 一级做a爰片久久| 亚洲国产日韩在线一区模特| 久久久久久久| 国产精品对白刺激久久久| 久久综合久久综合九色| av免费在线免费| 国产精品扒开腿爽爽爽视频 | 欧美国产一区视频在线观看| 18网站在线观看| 国产成人涩涩涩视频在线观看 | 亚洲影视资源| 欧美动漫一区二区| 一区二区三区在线播| 国产精品无码久久久久| 欧美一区二区在线| 狠狠干狠狠久久| 视频小说一区二区| www.爱色av.com| 日韩成人激情在线| 一本一本久久| 一二三四社区在线视频| 欧美极品少妇xxxxx| 国产成人免费在线观看| 国产精品剧情一区二区在线观看 | 久久国产一区二区| 亚洲午夜精品在线| 91成人福利| 日韩精品一区二区免费| 欧美一区二区视频网站| 天天射—综合中文网| 免费看黄视频网站| 欧美激情视频在线免费观看 欧美视频免费一| 日韩成人av影视| 91视频在线观看| 69174成人网| 亚洲.国产.中文慕字在线| 日本亚洲不卡| 成人免费淫片95视频观看网站| 色老头一区二区三区| 狠狠色丁香久久婷婷综合_中| av毛片在线看| 久久精品美女| 欧美性一区二区| 欧美99久久| 蜜桃视频在线播放| 91热福利电影| 福利视频导航一区| 经典一区二区| 五十度飞在线播放| 日韩美女免费观看| 亚洲欧美一区二区三区孕妇| 国产精品美女在线观看直播| 国产免费又粗又猛又爽| 欧美激情视频一区二区| 欧美激情一区二区三区不卡| 国产成人精品亚洲线观看| 色婷婷成人在线| 国产91精品高潮白浆喷水| 国产精品国产三级国产三级人妇| 99国产精品久久一区二区三区| 亚洲色精品三区二区一区| 播播国产欧美激情| 久久综合九色综合久久久精品综合| 日韩美女在线| 一区二区传媒有限公司| 欧美黑人巨大xxx极品| 亚洲欧洲国产日韩| 欧美一区2区| 男女污视频在线观看| 精品国产综合| 精品国产伦理网| 国产精品一区二区在线看| 日本免费成人| 91av俱乐部| 国产精品久久电影观看| 欧美中文字幕不卡| 美女脱光内衣内裤视频久久影院| 日韩欧美精品一区二区三区| 欧美三级一级片| 国产福利视频一区| 精品视频资源站| 久久精品久久综合| 2020国产精品小视频| www.三区| 高清不卡一区二区三区| 日韩成人xxxx| 国产欧美精品一区二区色综合| 国产一区不卡| 亚洲区欧洲区| 中国丰满人妻videoshd | 成人欧美一区二区三区的电影| 欧美大片免费播放| 美女撒尿一区二区三区| 亚洲精品高清在线观看| 午夜欧美精品| 粉嫩一区二区| 成全视频全集| 国产精品久久久久免费| 亚洲人在线观看| 亚洲欧美国产三级| 久久av一区| 亚洲国产精品免费视频| 韩国中文免费在线视频| 国产激情在线看| 热久久美女精品天天吊色| 555www色欧美视频| 日本一区二区高清| av成人激情| 一级毛片精品毛片| 老司机av在线免费看| 日韩av资源在线| 国产在线精品二区| 有码中文亚洲精品| 欧美视频免费在线观看| 岛国精品在线播放| 亚洲欧美综合久久久| 国产亚洲人成a在线v网站 | 成人直播在线| 国产福利在线免费| 一区二区三区四区五区精品| 欧美中文在线观看|