国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

一個數據科學負責人眼中的數據科學:太無聊了!

大數據
多人選擇數據科學(或機器學習)中令人興奮的東西來激勵自己和他人。但我們必須面對一個現實:真正的工作往往是「無聊的」——與人們認為浪漫的東西相比是無聊的。

筆者按,數據科學家的工作是否如你想象一般,每天建模型,調整參數,充滿了樂趣和挑戰?在 Dessa 的數據科學負責人 Ian Xiao 看來,或許并非如此。他認為,數據科學家的工作往往是非常「無聊的」,在決定踏上這條道路之前,我們必須對此做好心理準備,建立自己的應對機制。以下是他的全文。 

[[276851]]

Julian Howard 在 Unsplash 上的照片

 

TLDR:很多人選擇數據科學(或機器學習)中令人興奮的東西來激勵自己和他人。但我們必須面對一個現實:真正的工作往往是「無聊的」——與人們認為浪漫的東西相比是無聊的。感到無聊會造成緊張,它最終會導致數據科學領域工程師的高流動性。我想和大家分享我的實際工作以及如何應對「數據科學的枯燥」。我希望能幫助你——一個有抱負的數據科學家,去設定正確的期望。所以,一旦你決定從事數據科學的職業,你就要長期從事這項工作。享受它吧!

分享你的方法?我想強調的是,每個人都需要有一個應對機制。花 2 分鐘告訴我你的故事,也許接下來我們可以分享我們各自的應對方式,應該很有趣。

1.故事時間

我年輕英俊的表弟 Shawn 最近來到了加拿大,他來這里攻讀計算機科學碩士學位。和許多學生一樣,Shawn 對機器學習很有熱情,他想在兩年后畢業時成為一名數據科學家(或從事任何與 ML 有關的作)。

[[276852]]

作為一個真正關心 Shawn 前途的哥哥,我決定分享從我的數據科學生涯中學到的最謹慎的知識——這不是《哈佛商業評論》所描述的「21 世紀最性感的工作」,它枯燥乏味,令人筋疲力盡,令人沮喪——就像其他職業一樣。

我有義務告訴 Shawn 真相,即使真相令人失望。這將有助于他對自己的職業選擇做出明智的決定(更重要的是,我將避免凌晨 3 點接到我母親和叔叔的電話,他們肯定會給我上關于家庭、責任和誠實的課)。

[[276853]]

作為一個聰明、自驅、充滿好奇的年輕人,Shawn 想讓我詳細說明「無聊」具體指的是什么,于是我寫下了這篇文章。

此外,我們還討論了 ML 的主要趨勢,以及如何在這個領域脫穎而出。我將在一些后續文章中分享這一點。如果你感興趣,請接著往下看。

2.設置一些上下文

作為一名數據科學經理,我正在財富 100 強企業帶領團隊部署 ML 系統,管理客戶關系,并做一些技術工作。

這里先談談一些更重要的定義。ML 系統是一種解決業務領域問題的解決方案,它有一個 ML 組件,并且具有與人類或機器一起工作所需要的所有其他非 ML 系統內容。

部署意味著獲得驅動實際業務操作的解決方案。例如,設置用于訓練和驗證 ML 模型的實驗不是部署;設置通過電子郵件發送每月產品報價的推薦引擎是部署。部署 ML 系統面臨的問題與構建一個好的 ML 模型截然不同。如果你感興趣的話,可以在這里閱讀更多內容。

也就是說,我指的不是那些加入谷歌(google)或其他高科技公司,成為初級開發人員和技術經理的人。這些公司確實做得很好,但我認為它們只代表「前 1%」。其他財富 100 強企業往往在技術成熟度、應用速度以及對工具和工程人才的投資方面落后。

3.讓我們開始吧

簡而言之,當我說數據科學很無聊時,我指的是當人們意識到浪漫的期望和現實之間的差距時的那種壓抑感。

[[276854]]

大多數年輕的數據科學家希望把大部分時間花在構建和改進神秘的 ML 模型上,或者將時間花在用絢麗的可視化技術展示開創性的商業見解上。當然,這些確實是你工作的一部分。

但是,隨著企業成熟度的提高,他們更加注重實際的經營價值。這意味著企業希望部署更多的 ML 系統;他們不太關心他們有多少新模型或漂亮的報表。因此,數據科學家被要求做非 ML 工作。這讓他們感到很無聊。

讓我們進一步具體化數據科學中的「無聊」是什么樣子,如果我給你展示我從周一到周五的典型一天,你將發現那是非常無聊的。因此,我將把我的工作分類,突出展示預期與現實的對比,并分享我的應對機制。

我將使用「我們」為主語,因為這些例子是從和團隊的經驗集合中提取的。這些例子可能并不詳盡,但我認為它們會說明問題。

3.1設計(占據 5-10% 的時間)

這指的是我們整個集體一起努力獲得「高」智力來解決問題和提出高明的想法。這些想法可以包括新的模型架構、數據特性和系統設計等。很快,我們就會陷入低谷,因為由于時間限制和優先級的原因,我們需要采用最簡單(通常也是最無聊)的解決方案。

期望:我們實現的想法,可以在著名的 ML 期刊,如 NIPS,谷歌的人工智能研究博客等上面刊登,甚至可能贏得下一個諾貝爾獎。

現實:我們執行的事情能很好地完成工作。我們為一些值得裝幀的漂亮白板畫拍照。

[[276855]]

應對機制:1)和我領域外的朋友一起喝酒時繼續談論瘋狂的想法;他們可以殘忍地讓我停止這些瘋狂、愚蠢的想法;2)把瘋狂和聰明的想法作為輔助項目來做;3)結果是,大多數瘋狂的想法并沒有真正起作用或者只是比簡單的想法稍微好一點。所以 KISS 原則(保持簡單愚蠢,Keep-It-Simple-Stupid)總是給我安慰和結束。

3.2 編碼(會花費 20-70% 的時間,具體取決于角色)

這里沒什么好說的。在這個階段,我們戴上耳機,喝點咖啡,伸展手指,鎖定屏幕,打出漂亮的代碼行,讓魔術發生。

[[276856]]

我們的代碼通常分為五類,各個代碼行數占總代碼行數的百分比為:數據管道(50-70%)、系統和集成(10-20%)、ML 模型(5-10%)、支持調試和演示的分析(5-10%)。這與其他人的觀察結果大致一致。

 

一個數據科學負責人眼中的數據科學:太無聊了!

Sergey Karayev 的模型代碼在其全套深度學習課程中所占的比例

 

如你所見,我們大部分時間都在處理無聊的非 ML 內容。盡管 ML 組件非常關鍵,但現代的框架和編碼語言(例如 Keras, XGBoost, Python 的 sklearn 等)已經將許多復雜的東西抽象出來了。這意味著實現我們需要的結果不需要沉重的代碼庫;工作流已經很好地標準化和優化了(做低級優化是不同的,但它可能只是 1% 的情況)。

預期:你將花費大部分時間開發和優化 ML 組件,其他人將負責其余部分。

現實:沒有人希望 1)做你不想做的事情,2)你把所有的好東西都留給自己,3)你在一個已經很好優化的工作流程上花費了不相稱的時間。

應對機制:我們都會根據自己領域的專業知識做出決策,并在對他人發揮支持作用的同時成為自己領域的主要開發人員(例如,貢獻想法、進行實際開發或 QA)。這樣做可以讓我們在向他人學習的同時發揮自己的優勢。更重要的是,它有助于避免為了做「性感的工作」而產生矛盾。

3.3 QA、Debug 和修復 Sh*t(至少 65% 的時間)

在我看來,這是任何技術開發工作中最無聊、最痛苦的部分,開發 ML 系統也不例外。

在 ML 中,有兩種類型的「bug」:糟糕的結果和傳統的軟件問題。糟糕的結果是指低分數模型(例如,準確性或精確性)或不敏感的預測(例如,基于商業經驗的概率非常不準確)。代碼沒什么問題,只是結果不合理或不夠好。傳統的軟件問題包括諸如代碼損壞或系統配置等問題。

預期:我們只需要處理糟糕的結果,并想出更聰明的方法來建立更好的模型。這件事情還是有點吸引人的,看到由于一些好的想法而提高表現是非常值得的。

實際情況:在我們花在 QA /debug/apply 修復上的時間中,大約 70-90% 是在傳統的軟件問題上。通常,在建立端到端的模型訓練和驗證流程之后,我們可以相當快地獲得足夠好的結果。然后,我們經常將建模的優先級降低,以關注系統問題。

應對機制:我使用 github 的 Issue 特性將其游戲化并保留一個「獎杯板」。當我關閉 issue 時,我會立刻分泌多巴胺。看到我們「征服」的問題,我感到更加自豪。當然,我更自豪的是,當我點擊「go」時,一切都神奇地運行起來——這在大學里的編程作業中只發生過一次。我將終生記住這種感覺。如果它在現實生活中再次發生,很可能是出了問題。

一個數據科學負責人眼中的數據科學:太無聊了!

3.4 應對突發事件(10-50% 的時間)

[[276857]]

對于任何交付團隊的經理來說,這都是一場噩夢,而不是數據科學。不管時間線是怎么安排的,總會有事情發生,讓你偏離正軌。具體來說,這些突發事件可以分為三類:a)外部問題,如范圍更改、上游系統依賴性和客戶投訴;b)內部團隊問題,如惱人的 bug 需要比預期長得多的時間才能解決;人們需要過渡來適應新的工作內容得到新的工作;人員配備,性格沖突等,C)我自己的無知等等其它問題。

期望:從頭到尾按部就班;來自客戶、老板和團隊的熱烈掌聲和擁抱。

現實:意想不到的事情通常發生在最不方便的時候。沒有什么萬全的辦法來避免這些問題,這令人沮喪。

應對機制:1)將項目的時間線乘以 2-2.5 倍,以便在涉及到深層次的技術問題或跨團隊活動時留出足夠的緩沖空間;2)在內部設定進度時要有緊迫感;3)我在腦海中大聲發誓,好吧,在適當的情況下,有時會口頭發誓;4)呼吸、微笑和傾聽,5)與團隊一起探索所有可能的選擇,并根據可行性、需要的努力和阻力確定優先順序,6)如果這些都不起作用,不要等待,尋求幫助!7)執行。其中許多機制本身并不是應對機制,但它們是良好的做法,且一直運作良好。

4.總結

[[276858]]

我想強調的是,每個人都需要有一個應對機制。

所有這些都是想告訴你,現實世界的數據科學是困難的。有志于從事 ML 職業的人應該認識到,除了建立模型之外還有很多事情要做。你最終會感到無聊和沮喪,就像你對任何職業一樣。這是正常的。但最重要的是,你應該建立一個應對機制,這樣你就可以長期留在這個游戲中,享受一路上的小獎勵和最后的勝利。

本文轉自雷鋒網,如需轉載請至雷鋒網官網申請授權。

 

責任編輯:未麗燕 來源: 雷鋒網
相關推薦

2013-04-23 11:32:32

Internet2大數據SDN

2013-04-19 09:17:28

Internet2大數據SDN

2020-04-21 15:42:26

數據科學數據集數據

2016-12-02 19:40:41

數據分析

2016-11-28 15:21:54

谷歌大數據

2013-02-26 09:53:19

2018-11-19 06:00:32

數據科學家數據科學

2019-07-29 15:24:34

CEO技術負責人加班

2024-05-15 09:28:01

2020-08-23 12:26:59

數據科學家數據科學認證數據科學

2018-04-16 11:11:56

2014-05-21 16:04:38

面試面試規則

2020-12-10 10:29:32

大數據科學數據科學

2016-01-15 10:47:08

技術團隊能力

2012-12-13 11:12:24

戴爾

2011-08-23 17:02:37

FedoraLinux 20周年

2016-08-17 09:50:27

大數據數據科學家

2013-04-17 10:56:10

ONFOpenDayligh標準協議
點贊
收藏

51CTO技術棧公眾號

亚洲国产女人aaa毛片在线| 国产精品原创巨作av| 欧美日韩亚洲天堂| 不卡区在线中文字幕| 亚洲白拍色综合图区| 日本在线一区| 亚洲国产成人精品女人| 911国产网站尤物在线观看| 久久久久久夜精品精品免费| 精品中文字幕视频| 国产欧美精品区一区二区三区| 成人三级伦理片| 欧美xo影院| 亚洲精品一二三区区别| 欧美精品成人一区二区在线观看| 麻豆免费网站| 亚洲视频图片小说| 日本www高清视频| 日本一区二区三区国色天香 | 亚洲女厕所小便bbb| 激情网站五月天| 2021久久国产精品不只是精品| 精品国产免费一区二区三区四区| 天堂av中文在线资源库| 精品福利视频导航| 色网站在线免费观看| 久草中文综合在线| **亚洲第一综合导航网站| 欧美欧美欧美| 九色视频在线观看免费播放| 国产福利一区二区三区视频| 成人av手机在线观看| 91tv亚洲精品香蕉国产一区7ujn| 国产一区二区三区丝袜| 色综合中文字幕国产| 欧美精品123| 红桃视频欧美| 亲子乱一区二区三区电影| 三级在线电影| 午夜日韩电影| 国产精品秘入口| 电影天堂最新网址| 视频一区二区不卡| 91精品国产综合久久香蕉| 日产中文字幕在线精品一区| 欧美日韩在线精品一区二区三区激情综合| 精品视频色一区| 成人免费网站视频| 国内国产精品久久| 青青草原av在线播放| 亚洲欧美国产精品久久久久久久| 精品美女视频在线观看免费软件| av一本久道久久综合久久鬼色| 日本一区免费观看| 在线中文字幕电影| 日韩国产精品久久| 欧美成人亚洲成人日韩成人| 麻豆国产一区| 成人黄色午夜影院| 日本一不卡视频| www.99在线| 欧洲另类一二三四区| 亚洲欧洲自拍偷拍| 羞羞污视频在线观看| 国产精品996| 亚洲精品中文综合第一页| 激情亚洲网站| 亚洲精品一区二| 国产a区久久久| 亚洲电影一级黄| 成人超碰在线| 免费看男男www网站入口在线| 欧美日韩高清一区| 亚洲精品少妇一区二区| 久久精品视频一区二区三区| 免费成人av网站| 在线看片一区| 亚洲一区免费网站| 久久99精品一区二区三区三区| 中国一区二区三区| 欧美女同一区| 欧美一级黄色片| 四虎一区二区| 国产成人免费av在线| 亚欧美在线观看| 最新精品国偷自产在线| 久久精品国产电影| 日本女优在线视频一区二区| 久久久精品动漫| 欧美日韩第一区| 海角社区69精品视频| 91精品在线一区| 91日韩在线专区| 首页亚洲中字| 91精品一区二区三区综合在线爱| 在线观看日韩欧美| 欧美三级网页| www.精品在线| 亚洲欧美一区二区激情| 亚洲国产黄色| 五月婷婷六月丁香激情| 亚洲免费精彩视频| 亚洲视频在线a| 欧美精品粉嫩高潮一区二区| 亚洲精品自拍网| 日韩亚洲欧美在线| 欧美一区二区三| 九色91popny| 在线午夜精品自拍| 久久综合激情| 国产乱理伦片a级在线观看| 欧美激情亚洲激情| 国产精品一二三在| 久久久国产一区二区三区四区小说| 日韩色淫视频| 亚洲爆乳无码专区| 国产亚洲精品久久久久动| 国产精品99一区二区三| 有色激情视频免费在线| 宅男av一区二区三区| 精品一卡二卡三卡四卡日本乱码 | 天堂资源在线亚洲视频| 久久久777精品电影网影网| 九色porny视频在线观看| 欧美精品aa| 在线观看av片| 一本一道dvd在线观看免费视频| 一本大道香蕉8中文在线视频| 日本高清视频一区二区| 欧美午夜免费影院| 日韩深夜视频| 天天干天天干天天干天天干天天干| 精品国产一区二区在线| 欧美性猛交xxxx黑人交| gogogo高清在线观看免费完整版| 日韩美女福利视频| 国产精品美女久久久久久久久久久| 色综合视频一区二区三区日韩 | 国产91社区| 黄色欧美网站| 青青久久av北条麻妃黑人 | 在线观看福利一区| 亚洲精品美女在线| 大白屁股一区二区视频| 91福利精品在线观看| 欧美亚洲一级片| 亚洲欧美日韩国产手机在线 | 亚洲毛片在线看| 麻豆91精品91久久久的内涵| 91av资源网| 欧美激情久久久久| 中文字幕va一区二区三区| 高清国产福利在线观看| 国产精品亚洲综合| 粉嫩嫩av羞羞动漫久久久| 中文字幕高清在线播放| 成人一级生活片| 欧美国产日韩一区| 亚洲国产精品久久艾草纯爱 | 8888四色奇米在线观看| 色综合久久88色综合天天提莫| 亚洲精品中文字| 色综合久久中文| 最近最新中文字幕在线| 久久久久成人精品免费播放动漫| 精品国产一区二区三区不卡| 成人小视频在线| 超碰97久久国产精品牛牛| 精品不卡在线| 亚洲第一区在线| 91视频xxxx| 综合久久婷婷| 69堂免费精品视频在线播放| 手机福利视频欧美| 先锋在线资源一区二区三区| 欧美高清无遮挡| 欧美日韩亚洲综合| 91亚洲国产成人精品一区二区三| 欧美第一精品| 高清一区在线观看| 97神马电影| 中文字幕日韩欧美在线视频| 亚洲成人自拍偷拍| 国内精品伊人久久久久av一坑| 婷婷精品视频| 2018av在线| 五月综合激情在线| 亚洲国产成人精品久久| 久久久久久久久97黄色工厂| 一区二区三区四区电影| 91精品影视| 可以在线观看的av网站| 3d动漫一区二区三区| 国产精品久久久久久久久久直播| 久久黄色av网站| 911精品产国品一二三产区| 久久美女艺术照精彩视频福利播放| 亚洲午夜在线| 精品亚洲精品| 第四色日韩影片|