国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大數(shù)據(jù)領(lǐng)域的12大工具,試試看哪個(gè)更好用

譯文
大數(shù)據(jù)
為了滿足旺盛需求,大數(shù)據(jù)工具在迅速遍地開(kāi)花。在大數(shù)據(jù)這一概念和業(yè)務(wù)戰(zhàn)略出現(xiàn)以來(lái)的十年間,市面上出現(xiàn)了成千上萬(wàn)執(zhí)行各種任務(wù)和流程的工具,它們都承諾可為你節(jié)省時(shí)間和資金,發(fā)掘業(yè)務(wù)洞察力從而實(shí)現(xiàn)創(chuàng)收。顯然,一個(gè)不斷增長(zhǎng)的市場(chǎng)呈現(xiàn)在大數(shù)據(jù)分析工具的面前。

【51CTO.com快譯】大數(shù)據(jù)工具讓企業(yè)能夠從數(shù)據(jù)倉(cāng)庫(kù)獲得洞察力,從而在數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)環(huán)境中提供重要的競(jìng)爭(zhēng)優(yōu)勢(shì)。

為了滿足旺盛需求,大數(shù)據(jù)工具在迅速遍地開(kāi)花。在大數(shù)據(jù)這一概念和業(yè)務(wù)戰(zhàn)略出現(xiàn)以來(lái)的十年間,市面上出現(xiàn)了成千上萬(wàn)執(zhí)行各種任務(wù)和流程的工具,它們都承諾可為你節(jié)省時(shí)間和資金,發(fā)掘業(yè)務(wù)洞察力從而實(shí)現(xiàn)創(chuàng)收。顯然,一個(gè)不斷增長(zhǎng)的市場(chǎng)呈現(xiàn)在大數(shù)據(jù)分析工具的面前。

其中許多工具一開(kāi)始就像最初的大數(shù)據(jù)軟件框架Hadoop那樣是開(kāi)源項(xiàng)目,但后來(lái)商業(yè)公司迅速涌現(xiàn),為開(kāi)源產(chǎn)品提供新工具或商業(yè)支持和開(kāi)發(fā)。

從中進(jìn)行遴選可能很困難,尤其是許多大數(shù)據(jù)工具用途單一,而你可以用大數(shù)據(jù)處理許多不同的任務(wù),所以你的分析工具箱會(huì)塞得滿滿當(dāng)當(dāng)。本文我們列出了市面上主要的大數(shù)據(jù)分析工具,分三大?類(lèi)別來(lái)介紹。

主要的大數(shù)據(jù)工具

如前所述,大數(shù)據(jù)工具往往屬于單一用途類(lèi)別,而使用大數(shù)據(jù)有多種方式。所以我們將按類(lèi)別細(xì)分,然后討論每個(gè)類(lèi)別的分析工具。

一、大數(shù)據(jù)工具:數(shù)據(jù)存儲(chǔ)和管理

大數(shù)據(jù)完全始于數(shù)據(jù)存儲(chǔ),也就是說(shuō)始于大數(shù)據(jù)框架Hadoop。它是Apache基金會(huì)運(yùn)行的一種開(kāi)源軟件框架,用于在大眾化計(jì)算機(jī)集群上分布式存儲(chǔ)非常大的數(shù)據(jù)集。

很顯然,由于大數(shù)據(jù)需要大量的信息,存儲(chǔ)至關(guān)重要。但除了存儲(chǔ)外,還需要某種方式將所有這些數(shù)據(jù)匯集成某種格式化/治理結(jié)構(gòu),從而獲得洞察力。因此,大數(shù)據(jù)存儲(chǔ)和管理是真正的基礎(chǔ)――離開(kāi)了它,分析平臺(tái)一無(wú)是處。在一些情況下,這些解決方案還包括員工培訓(xùn)。

這個(gè)領(lǐng)域的大玩家包括:

1. Cloudera

實(shí)際上是增加了一些額外服務(wù)的Hadoop,你會(huì)需要它,因?yàn)榇髷?shù)據(jù)不容易搞。Cloudera的服務(wù)團(tuán)隊(duì)不僅可以幫助你構(gòu)建大數(shù)據(jù)集群,還可以幫助培訓(xùn)你的員工,更好地訪問(wèn)數(shù)據(jù)。

2. MongoDB

MongoDB是最受歡迎的大數(shù)據(jù)數(shù)據(jù)庫(kù),因?yàn)樗m用于管理經(jīng)常變化的數(shù)據(jù):非結(jié)構(gòu)化數(shù)據(jù),大數(shù)據(jù)常常是非結(jié)構(gòu)化數(shù)據(jù)。

3. Talend

作為一家提供廣泛解決方案的公司,Talend的產(chǎn)品圍繞其集成平臺(tái)而建,該平臺(tái)集大數(shù)據(jù)、云、應(yīng)用程序、實(shí)時(shí)數(shù)據(jù)集成、數(shù)據(jù)準(zhǔn)備和主數(shù)據(jù)管理于一體。

圖1:Talend大數(shù)據(jù)集成平臺(tái)包括數(shù)據(jù)質(zhì)量和治理功能

二、大數(shù)據(jù)工具:數(shù)據(jù)清理

在你真正處理數(shù)據(jù)以獲取洞察力之前,需要清理和轉(zhuǎn)換數(shù)據(jù),轉(zhuǎn)換成可遠(yuǎn)程搜索的內(nèi)容。大數(shù)據(jù)集往往是非結(jié)構(gòu)化、無(wú)組織的,因此需要某種清理或轉(zhuǎn)換。

當(dāng)下,數(shù)據(jù)可能來(lái)自任何地方:移動(dòng)、物聯(lián)網(wǎng)和社交媒體,數(shù)據(jù)清理顯得更為必要。并非所有這些數(shù)據(jù)都可以輕松“清理”以獲得洞察力,因此優(yōu)秀的數(shù)據(jù)清理工具極其重要。實(shí)際上,在未來(lái)幾年,預(yù)計(jì)經(jīng)過(guò)有效清理的數(shù)據(jù)會(huì)是可接受的大數(shù)據(jù)系統(tǒng)與真正出色的大數(shù)據(jù)系統(tǒng)之間的競(jìng)爭(zhēng)優(yōu)勢(shì)。

4. OpenRefine

OpenRefine是一款易于使用的開(kāi)源工具,通過(guò)刪除重復(fù)項(xiàng)、空白字段及??其他錯(cuò)誤來(lái)清理凌亂的數(shù)據(jù)。它是開(kāi)源的,但有一個(gè)相當(dāng)大的社區(qū)可提供幫助。

5. DataCleaner

與OpenRefine一樣,DataCleaner可將半結(jié)構(gòu)化數(shù)據(jù)集轉(zhuǎn)換成數(shù)據(jù)可視化工具可以讀取的干凈可讀的數(shù)據(jù)集。該公司還提供數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)管理服務(wù)。

6. 微軟Excel

說(shuō)真的,Excel有其用途。你可以從各種數(shù)據(jù)源導(dǎo)入數(shù)據(jù)。Excel在手動(dòng)數(shù)據(jù)輸入和復(fù)制/粘貼操作方面特別有用。它能消除重復(fù)項(xiàng),查找和替換內(nèi)容,檢查拼寫(xiě),還有用于轉(zhuǎn)換數(shù)據(jù)的許多公式。但Excel很快陷入困境,不適合龐大數(shù)據(jù)集。

三、大數(shù)據(jù)工具:數(shù)據(jù)挖掘

一旦數(shù)據(jù)經(jīng)過(guò)清理和準(zhǔn)備,你可以通過(guò)數(shù)據(jù)挖掘開(kāi)始搜索數(shù)據(jù)了。這時(shí)你執(zhí)行這個(gè)實(shí)際的過(guò)程:發(fā)現(xiàn)數(shù)據(jù)、做出決定和進(jìn)行預(yù)測(cè)。

數(shù)據(jù)挖掘是大數(shù)據(jù)流程的真正核心。數(shù)據(jù)挖掘解決方案通常底層很復(fù)雜,但竭力提供 一種外觀漂亮、對(duì)用戶友好的用戶界面,說(shuō)起來(lái)容易做起來(lái)難。數(shù)據(jù)挖掘工具面臨的另一個(gè)挑戰(zhàn)是:它們確實(shí)需要人來(lái)編制查詢(xún),所以數(shù)據(jù)挖掘工具的好壞取決于使用它的專(zhuān)業(yè)人員。

7. RapidMiner

RapidMiner是一款易于使用的預(yù)測(cè)分析工具,有著對(duì)用戶友好的可視化界面,這意味著你沒(méi)必要編寫(xiě)代碼即可運(yùn)行分析產(chǎn)品。

8. IBM SPSS Modeler

IBM SPSS Modeler是一款包括五個(gè)數(shù)據(jù)挖掘產(chǎn)品的套件,面向企業(yè)級(jí)高級(jí)分析。另外IBM的服務(wù)和咨詢(xún)首屈一指。

9. Teradata

Teradata為數(shù)據(jù)倉(cāng)庫(kù)、大數(shù)據(jù)和分析以及營(yíng)銷(xiāo)等應(yīng)用提供端到端解決方案。這一切意味著貴公司可以真正成為數(shù)據(jù)驅(qū)動(dòng)的公司,另外還有商業(yè)服務(wù)、咨詢(xún)、培訓(xùn)和支持。

圖2:與許多目前的大數(shù)據(jù)工具一樣,RapidMiner解決方案也支持云

大數(shù)據(jù)工具:數(shù)據(jù)可視化

數(shù)據(jù)可視化是指以一種可讀、實(shí)用的格式顯示你的數(shù)據(jù)。你可以查看圖表圖形以及直觀顯示數(shù)據(jù)的其他圖像。

數(shù)據(jù)可視化既是一門(mén)科學(xué),又是一門(mén)藝術(shù)。隨著大數(shù)據(jù)從有大批數(shù)據(jù)科學(xué)家支持的高管轉(zhuǎn)移到整個(gè)公司上下,眾多員工可以使用可視化工具極為重要。銷(xiāo)售代表、IT支持和中層管理,這些團(tuán)隊(duì)個(gè)個(gè)都需要能夠理解數(shù)據(jù),因此重點(diǎn)放在易用性上。然而,易于閱讀的可視化有時(shí)與來(lái)自深度特征集的數(shù)據(jù)讀出相沖突,這帶來(lái)了數(shù)據(jù)可視化工具面臨的主要挑戰(zhàn)之一。

10. Tableau

Tableau是該領(lǐng)域的領(lǐng)導(dǎo)者,其數(shù)據(jù)可視化工具專(zhuān)注于商業(yè)智能,無(wú)需懂得編程,即可創(chuàng)建各種地圖、圖表、圖形及更多可視化元素。它共有五款產(chǎn)品,一款名為T(mén)ableau Public的免費(fèi)版供潛在客戶試用。

11. Silk

Silk是Tableau的簡(jiǎn)單版,讓你可以通過(guò)地圖和圖表將數(shù)據(jù)可視化,無(wú)需任何編程。你在首次加載Silk時(shí),它甚至?xí)囍鴮?shù)據(jù)可視化。它還讓用戶很容易在網(wǎng)上發(fā)布結(jié)果。

12. Chartio

Chartio使用自己的可視化查詢(xún)語(yǔ)言,只要點(diǎn)擊幾下鼠標(biāo)即可創(chuàng)建功能強(qiáng)大的儀表板,無(wú)需懂得SQL或其他建模語(yǔ)言。它有別于其他工具的地方主要在于,你可以直接連接到數(shù)據(jù)庫(kù),因此不需要數(shù)據(jù)倉(cāng)庫(kù)。

IBM Watson Analytics

IBM Watson Analytics結(jié)合了機(jī)器學(xué)習(xí)和人工智能,有助于提供智能數(shù)據(jù)科學(xué)助手,為業(yè)務(wù)分析員和數(shù)據(jù)科學(xué)家等擁有眾多數(shù)據(jù)科學(xué)技能的用戶扮演了向?qū)А?/p>

大數(shù)據(jù)工具的三個(gè)層次

普華永道的移動(dòng)數(shù)據(jù)和分析計(jì)劃首席技術(shù)官Ritesh Ramesh表示,就先進(jìn)程度和市場(chǎng)戰(zhàn)略而言,大數(shù)據(jù)工具可分成三層金字塔。

第一層:最龐大的是一系列開(kāi)源工具。每家公司以開(kāi)源起家,像Cloudera和Hortonworks。除了基本的基礎(chǔ)設(shè)施、服務(wù)器和存儲(chǔ)外,沒(méi)有多大的價(jià)值。大多數(shù)云廠商已將這一層實(shí)現(xiàn)了商品化。

第二層:在這一層,大多數(shù)這類(lèi)廠商已有意增加各自的市場(chǎng)份額,在開(kāi)源工具上面構(gòu)建一些專(zhuān)有應(yīng)用程序,從而做到與眾不同。舉例說(shuō),Cloudera開(kāi)發(fā)了許多產(chǎn)品,比如駐留在Hadoop核心上的數(shù)據(jù)科學(xué)平臺(tái)。

第三層:這些是針對(duì)特定垂直領(lǐng)域的應(yīng)用程序。這些公司大多與普華永道、高知特或埃森哲等系統(tǒng)集成商合作。真正的價(jià)值出在這里,這對(duì)大數(shù)據(jù)工具開(kāi)發(fā)商來(lái)說(shuō)也是非常有效的競(jìng)爭(zhēng)策略。

Ramesh表示,除了基本功能外,這些工具的三大方面?zhèn)涫軞g迎。首先是數(shù)據(jù)處理工具。他說(shuō):“數(shù)據(jù)學(xué)習(xí)工具是客戶的工具箱中確保數(shù)據(jù)質(zhì)量和分析數(shù)據(jù)的重要工具,比如處理5000萬(wàn)行數(shù)據(jù)以發(fā)現(xiàn)洞察力。”

他表示,領(lǐng)先的廠商包括Trifacta、Paxata和Talend。

第二大類(lèi)應(yīng)用程序是治理,比如你如何定義元數(shù)據(jù)。他說(shuō):“好多人在這方面遇到困難。人們只是將大量垃圾數(shù)據(jù)倒到數(shù)據(jù)湖。市面上可在數(shù)據(jù)湖中積極發(fā)揮功效的工具不多。由于這項(xiàng)工作主要由IT人員完成,他們更有興趣將數(shù)據(jù)倒到數(shù)據(jù)湖,而不是確立一種治理結(jié)構(gòu)。”

主要廠商包括Waterline Data、以數(shù)據(jù)編目工具見(jiàn)長(zhǎng)的Tamr和Collibra。

Ramesh說(shuō),經(jīng)常出現(xiàn)的第三大需求是安全。他說(shuō):“人們希望一個(gè)產(chǎn)品就有安全訪問(wèn)的所有層(列、行和對(duì)象)。他們希望一款產(chǎn)品為不同的數(shù)據(jù)對(duì)象支持用戶訪問(wèn)和安全。這也是個(gè)新興領(lǐng)域。”

這個(gè)領(lǐng)域的主要廠商是Wandisco和FireEye。

原文標(biāo)題:Top 12 Big Data Tools,作者:Andy Patrizio

【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】

責(zé)任編輯:武曉燕 來(lái)源: 51CTO
相關(guān)推薦

2016-12-16 12:32:50

阿里數(shù)據(jù)分析職業(yè)要求

2023-12-30 08:16:34

Django權(quán)限控制庫(kù)

2016-08-29 22:34:24

大數(shù)據(jù)工具

2016-03-21 09:56:41

Spark大數(shù)據(jù)處理Apache

2016-07-05 15:49:39

大數(shù)據(jù)動(dòng)向

2022-06-26 23:31:17

Java開(kāi)發(fā)語(yǔ)言

2020-09-04 15:13:43

Java 8接口物流信息

2019-07-27 09:40:56

MySQLPG數(shù)據(jù)庫(kù)

2018-04-17 12:58:52

大數(shù)據(jù)工具大數(shù)據(jù)數(shù)據(jù)可視化

2020-12-08 10:25:56

HibernateMyBatis數(shù)據(jù)庫(kù)

2019-04-29 13:20:00

大數(shù)據(jù)工具數(shù)據(jù)庫(kù)

2012-12-25 09:58:50

數(shù)據(jù)科學(xué)家大數(shù)據(jù)

2017-07-27 14:18:41

大數(shù)據(jù)挑戰(zhàn)動(dòng)向

2016-05-30 10:15:56

2018-12-25 09:00:59

2020-06-08 11:30:04

PGMySQL數(shù)據(jù)庫(kù)

2016-10-12 19:14:31

2014-07-01 09:17:34

大數(shù)據(jù)

2022-10-19 10:52:31

大數(shù)據(jù)金融

2019-04-28 11:15:36

Kubernetes開(kāi)源工具
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产视频精品自拍| 99re8这里有精品热视频免费| 美女爽到呻吟久久久久| 97在线免费观看| 亚洲日韩中文字幕一区| 老司机午夜精品99久久| 日韩欧美一级二级| 免费理论片在线观看播放老| 亚洲欧洲日韩一区二区三区| 国产老熟妇精品观看| 人禽交欧美网站| 亚洲精品自在久久| 国产一线二线在线观看| 欧美美女喷水视频| av网页在线| 天堂久久久久va久久久久| 91中文字幕在线观看| 欧美色视频免费| 欧美日韩在线免费观看| 资源视频在线播放免费| 一区二区国产精品| 久久国产精品-国产精品| 成人直播视频| 亚洲区一区二区| 人人澡人人爽| 亚洲免费在线视频| 中文字幕毛片| 色综合激情五月| 成人国产在线看| 国产成人综合在线观看| 免费一级特黄毛片| 国产免费久久| 国产精品流白浆视频| 成人免费在线播放| 国产免费一区二区三区| 视频一区视频二区中文| 黄色高清视频网站| 日韩欧美天堂| 欧美另类变人与禽xxxxx| 麻豆视频在线免费观看| 亚洲激情免费观看| 最新亚洲国产| 国产精品专区一| 久久婷婷亚洲| 97国产在线播放| 亚洲精品精品亚洲| 五月天婷婷在线视频| 波多野结衣在线aⅴ中文字幕不卡| 蜜臀av色欲a片无码精品一区| 久久久综合网站| 久草在线中文888| 欧美一区二区成人| 精品日本视频| 国产97在线视频| 激情综合激情| 日韩亚洲欧美一区二区| 中文字幕一区二区在线观看| 久久综合一区二区三区| 激情都市一区二区| 国产一级不卡毛片| 欧美艳星brazzers| 欧美日韩卡一| 91人成网站www| 国内精品在线播放| 加勒比一区二区三区| 7777精品伊人久久久大香线蕉完整版| 天堂中文在线播放| 国产精品免费久久久久影院| 九色综合国产一区二区三区| 97高清视频| 欧美精品一区二区三区四区| 在线观看国产麻豆| 国产欧美日韩精品在线| 欧美扣逼视频| 久久精品国产清自在天天线| 欧美一区二区三区久久精品| 欧美高清一级大片| 亚洲香蕉网站| 久久久免费视频网站| 欧美日韩高清一区| 久久夜色电影| 艳母动漫在线免费观看| 亚洲欧美韩国综合色| 毛片网站在线看| 日韩av观看网址| 高清av一区二区| 你懂的视频在线免费| 色妞一区二区三区| 国产精品大片| 黄色三及免费看| 国产香蕉精品视频一区二区三区| 亚洲啊v在线观看| 北条麻妃av高潮尖叫在线观看| 91精品国产麻豆国产自产在线| 日韩精品导航| 99热久久这里只有精品| 欧美一区二区网站| av一区二区在线播放| 97碰碰碰免费色视频| 国产精品久久久久久av福利软件 | 国产亚洲综合视频| 欧美视频精品在线| 亚洲精品一二三**| 成年人免费观看的视频| 欧美在线观看视频在线| 国产成人精品亚洲线观看| 亚洲午夜久久久影院伊人| 亚洲一区二区免费视频| 一区二区三区四区国产| 色天天综合久久久久综合片| 成人资源在线| www.男人天堂网| 亚洲成人久久电影| 国产蜜臀在线| 国产日韩综合一区二区性色av| 四虎5151久久欧美毛片| 日韩小视频在线播放| 精品国产一区二区精华| 亚洲精品美女91| 激情小视频在线| 成人在线国产精品| 午夜精品免费在线| 精品国产一区二区三区四区| 男人的天堂www| 国内精品一区二区三区| 久久精品一区二区| 国产在线不卡一区二区三区| 欧美国产欧美亚洲国产日韩mv天天看完整| 久久亚洲国产精品一区二区| 成人免费在线观看| 精品1区2区在线观看| 伊人久久亚洲影院| 成人免费高清在线播放| 91日本在线视频| 色哟哟国产精品| 国产精品大片免费观看| 成人高清免费观看mv| 不卡视频一区二区| 久久久久久黄| 老司机99精品99| 奇米影视首页 狠狠色丁香婷婷久久综合| 日本道免费精品一区二区三区| 婷婷综合亚洲| 亚洲综合在线一区| 成人情视频高清免费观看电影| 麻豆精品国产传媒mv男同| 欧美日韩在线视频免费观看| 色999五月色| 国产精品无人区| 99re8这里有精品热视频8在线 | 爽好久久久欧美精品| 成人福利片网站| 熟女熟妇伦久久影院毛片一区二区| 国产网站欧美日韩免费精品在线观看| 国产成人免费在线视频| 成人综合日日夜夜| 一级免费视频| 国产精品免费观看高清| 欧美变态tickling挠脚心| 国产麻豆视频精品| 无需播放器的av| 欧美中文字幕一区| 久久狠狠一本精品综合网| 一本大道色婷婷在线| 精品久久久久久久免费人妻| 欧美日韩国产免费一区二区 | 2019中文字幕在线免费观看| 欧美成人免费一级人片100| 欧美日韩成人在线播放| 亚洲另类av| 亚洲欧美另类图片| 久久综合中文色婷婷| 伊人精品在线观看| 亚洲精品v日韩精品| 中文一区一区三区免费在线观看| 蜜桃网站在线观看| 亚洲免费av高清| 精品福利av| 色尼玛亚洲综合影院| 99999色| 亚洲无线码在线一区观看| 久久精品亚洲麻豆av一区二区| 你懂的一区二区三区| 国产原厂视频在线观看| 亚洲精品蜜桃久久久久久| 国产精品久久久久久久电影 | 久久人人爽亚洲精品天堂| 136国产福利精品导航网址| 三妻四妾的电影电视剧在线观看| 成年人视频在线免费| 国产精品久久波多野结衣| www欧美日韩| 在线观看一区二区视频| 成人激情小说乱人伦| 国产精品久久久久久久| 午夜影院在线播放| 绯色av一区| 好吊妞无缓冲视频观看| 国产精品入口免费| 91av视频导航|