助你所在團隊走上大數據路途的六大規則
原創【51CTO.com原創稿件】大數據概論
“大數據”是近兩年來各界最熱議的話題之一。那么大數據究竟是什么?
據我個人理解,大數據包括結構化數據(Structured Data)和非結構化數據(Unstructured Data)。數據來源包括傳統交易如企業ERP、財務、CRM系統和潛在海量的數字來源如網頁、移動應用用戶行為、教育視頻點播和媒體資源。
由于“大數據”的熱點集中和可以處理海量數據如大規模并行計算(massively parallel computing)、云計算、Hadoop和MapReduce。因此,Oracle、IBM、微軟、SAP和其他大廠家目前共同在推動相關對話。但光談技術解決不了中國非500強企業所面臨的行業競爭和混亂。這些企業已了解轉型的必要性和緊迫性,關注的話題包含集合傳統數據和數字數據產生的洞察和如何形成研究問題。當然非500強企業也了解B744引擎放不進拖拉機,所以偏向先建立扎實的數據分析基礎,優化用戶體驗。
我也堅信大數據確實帶來新業務機遇,但目前更關注數據如何驅動企業實際價值。本文將分享Countly與客戶合作所獲取的經驗。
大數據的六大規則。
從Countly累計的經驗,我整理了一些規則適合“小”和“大”的數據領域。當你開始你的大數據路途,這些規則將會幫你縮短學習曲線,并獲得更大的價值:
1、在早期階段,先建立數據燈塔再考慮大數據。
好好規劃你的數據項目。在最初期,建議“失敗快,但往前跌”(fail faster while failing forward)的規劃。不要花24個月搭建海量的大數據環境,后期再發現這是你***的錯誤。
你可以相當快開始采集數據、建立非完善的數據倉庫和做數據分析。這種組建可稱為數據燈塔,先關注三大趨勢:
- 發現以前未知的走勢或關鍵驅動因素
- 摸索異常的記錄
- 理解數據中的相關性
覆蓋率有可能不完善,但獲取一些立竿見影的成果和指引后期的擴展。關鍵是一開始得考慮規劃擴展性和靈活性的選擇。
2、建立大數據思考。
Avinash Kaushik,一位數字分析的專家,倡導采用框架的數字營銷計量模型確保數據分析項目針對公司最重要的業務(請查看Avinash所整理的以下例子)。此外,你必須與高層有共識,不需太細,但在一頁面總結明確的業務目標與實現。
數字營銷核心指標
當你通過數據燈塔掌握這些數據,你所獲取的見解將帶給你驚喜。你對企業的影響將是巨大的,因為在很多企業還沒集合傳統數據和數字數據。
3、如果大數據思考比大數據技術更重要,那么在技術方面我們又能做些什么呢?
當你的公司使用免費的用戶分析平臺,如Google Analytics或友盟,你的數據將是產品,為廠家建立附加值(如谷歌Adsense)。由于虛擬商業模式抄襲是市場最隆重的贊美,自部署或在私人化的部署越主流以保障數據安全和靈活融合數據。
讓我們繼續討論數字數據解決方案。由于你需要評估成本、二次開發靈活性、可擴展性、數據所有權和性能,可考慮開放的平臺,如Countly用戶行為分析平臺和其他推薦數據可視化和其他實用的Javascript軟件。
4、先追求正確的時刻獲取數據,而不是實時數據。
另外,建議你先徹底了解你的公司目前如何組織數據,然后把數字數據融入現有流程。始終目標是如何匹配數據傳化成見解和洞察。如果實時數據沒創造業務價值,你何必投入資源實現呢?而且你的公司將省很多錢,因為海量的實時數據肯定不便宜!
數據采集過后,你的公司需要任何人工處理嗎?如果答案是需要,那么你不需要實時數據,你需要正確的時刻獲取數據。如果你有智能或規則驅動的自動化系統,那么你可考慮獲取實時數據的“原材料”。
5、數據質量差,但還是得做業務決定。
我們的目標應該是盡可能地采集、處理和存儲數據。這流程可能不完善,但數字數據仍然具有價值。因為相對于任何的傳統來源,數字數據讓你建立最完善的用戶畫面與傳化。
數字數據質量確實有優化的空間,如何處理視頻或眼花繚亂的社會媒體平臺。但市場不會等你做這些優化,所以開始憑數據做小決定。記住,即使這些決定將是革命性的,因為數字與傳統數據集在好多公司從來沒集合!隨著經驗的累計和了解數據的限制,你將可以做更多附加值的決定。
6、消除噪音比找到信號更有價值。
到目前為止,我們查詢的目標是從所有噪音摸索有價值的信號。以掌握正確的信號,前提包括清晰的研究問題、數據規模較小、數據集更完整。前美國國防部長DonaldRumsfeld所謂的已知的已知(Known Knowns)和已知的未知(Known Unknowns)。Rumsfeld采用這概念討論反恐情報的噪音,但也適用于分析和研究(請查看以下模式),做明智的業務決定。當然,“未知”的象限需要你的公司累計經驗才可以比較進行有效探討。
已知的已知模式(來自TextOre)
以建立數據燈塔和面臨大數據時代,你必須知道如何消除海量數據量的噪音,才可能開始尋找信號。
六個簡單的規則,讓你們革命者遵循,確保,革命成功。
這六條規則正在解決***執行官的問題,而不是CIO或CTO。因此,所思考的的問題較宏觀。此外,討論大數據之前,我建議先建立扎實的基礎,通過大數據思考并搭建數據燈塔。
你覺得以上的框架有價值嗎?它會驅使你改變對大數據的處理方式嗎?關于以上的規則,哪一條規則最實用?你從經驗中分享的***的數據建議是什么?期待回音!
作者介紹
陳俊勛是Countly的中國與亞太區的市場經理。Countly 代表一種新類型的互動協作技術,從而為技術型和非技術型利益相關者提供一條求知和創新之路。Countly建立了一個開放的Web和移動解決方案,允許公司掌握自己的數據,回答針對不同領域需求的問題。因此,Countly 的格言相當簡單,“贏在定制” 。如果你有意向分享自己公司在數據分析的不平凡之路,歡迎隨時聯系 Countly(hello@count.ly)。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】



























