大數據應用開發(fā)的12個輔助開發(fā)工具
在大數據應用的開發(fā)中, 除了基礎的Hadoop或者R語言之外,還有很多優(yōu)秀的輔助開發(fā)工具, 能使開發(fā)者如虎添翼。
就像當年的舊金山淘金熱時, ***掙錢的除了淘金者, 還有Levi’s這樣的做牛仔褲的和那些給淘金這賣水的人,在現在的大數據淘金熱里, 也出現了很多提供開發(fā)工具或者開發(fā)環(huán)境的公司。 下面介紹12個公司和他們的工具, 無論你是從事大數據應用的開發(fā),還是希望分析你的移動應用,這些工具都可以幫助你更好的淘金。
1) BitDeli
BitDeli是一家剛剛成立的公司, 他的產品就是可以讓開發(fā)者利用Python腳本, 對應用進行分析。 Python腳本可以很簡單, 也可以很復雜。 一切可以由開發(fā)者來定制。 BitDeli的產品甚至包含了一些機器學習的模塊。相比較龐大的Hadoop分析工具, BitDeli把自己比作是應用分析方面的RoR (Ruby on Rail)。

2) Continuity
Continuity的兩個創(chuàng)始人是雅虎的前***云架構師Todd Papaioannou和前Facebook的HiBase工程師 Jonathan Gray。 他們的目的, 就是想使客戶能夠像雅虎和Facebook
利用大數據。 Continuity的產品App Fabric主要是把復雜的與Hadoop和HBase集群的工作作為一個抽象層, 提供各種大數據開發(fā)工具, 來滿足企業(yè)內部或外部數據需求。
#p#
3) Flurry
Flurry是個一站式的移動應用商店, 它每年已經有100美元的營收了。 它不但幫助開發(fā)者在它的平臺上開發(fā),還可以幫助開發(fā)者通過運營數據, 對應用進行分析以改善應用。 而且, Flurry平臺還可以和廣告網絡相對接, 幫助開發(fā)者更好的實現盈利。

4) Google Predictive API
在Google提供的眾多開發(fā)工具中, Google Predictive API 是最酷的一個了。如果你有好的訓練樣本數據, 那么Google Predictive API將會利用機器學習算法來為你的應用建立模型,并把這些模型整合到你的應用中去。 在Google給出的例程里, 包括了反垃圾郵件, 推薦引擎, 以及情緒分析等模型的搭建步驟和代碼。
#p#
5) Infochimps
盡管Infochimps把自己定義為面向企業(yè)的IT平臺, 他們大數據平臺對開發(fā)者來說也非常有幫助。它的技術平臺叫做Wukong(悟空), 用來進行大數據環(huán)境的配置和管理。 從起一個Hadoop進程到用Ruby腳本來傳遞數據流。 Wukong都可以讓開發(fā)者的工作變得更簡單。 此外, Infochimps的平臺還包括了一個數據市場,以API或者下載方式提供各類數據。

6) Keen IO
Keen IO是個強大的移動應用分析工具。 開發(fā)者只需要簡單到一行代碼, 就可以跟蹤他們想要的關于他們應用的任何信息。開發(fā)者接下來只需要做一些Dashboard或者查詢的工作就可以了。
#p#
7)Kontagent
Kontagent是一個移動, 社交, 網站應用的分析平臺。 它基于Hadoop大數據平臺而建。 今年, Kontagent平臺增添了新功能。 它可以讓用戶直接采用Hive查詢語言對數據進行任意查詢和分析,而不像原來那樣只能進行預定義的查詢和分析

8) Mortar Data
Mortar Data是專為開發(fā)者打造的Hadoop開發(fā)平臺,它用Pig 和Python的組合替代了MapReduce以便開發(fā)者能簡單地編寫Hadoop管道(Pipeline)。 今年11月, 它推出了Mortar Data開源開發(fā)框架, 利用開源社區(qū)來推動數據共享。 Mortar Data平臺運行在亞馬遜的云平臺上。 支持亞馬遜S3 以及MangoDB。 #p#
9) Placed Analytics
利用腳本語言以及API, Placed Analytics能夠提供針對移動和網絡應用的詳細用戶行為分析。包括, 用戶使用時間和地理位置信息。 這些可以幫助開發(fā)者的應用更好地吸引廣告商, 也可以幫助開發(fā)者對自己的應用進行改善。

10) Precog
Precog提供的是一個基于開源查詢語言Quirrel的交互式開發(fā)環(huán)境, 名為Labcoat??梢詭椭_發(fā)者進行應用分析的開發(fā)。 這個IDE環(huán)境還提供了關于Quirrel的教程,以及其他一些復雜的函數。 用公司***運營官Jeff Carr的話來說:“就算是一個非技術人員, 幾個小時也能掌握基本功能。” #p#
11) Spring For Apache Hadoop
盡管Hadoop是用Java寫的, 但是這并不意味著, 在Hadoop上編程或者使用Hadoop對Java程序員來說就很簡單。因此, 在2012年初, SpringSource宣布推出了Spring For Apache Hadoop項目。 把Spring開發(fā)框架和Hadoop結合起來。 這樣也便于其他的Spring應用或者基于Java虛擬機的腳本, 更好地和Hadoop以及利用Hadoop的其他技術如Hive或者HBase進行整合。
12) StatMix
和BitDeli以及Keen IO一樣, StatMix也希望能夠使開發(fā)者用他們所熟知的語言來進行數據查詢與分析。 因此, 出來提供預定義的查詢之外, StatMix也提供API和代碼庫來讓開發(fā)者定制化的查詢。 并可以把不同數據源的查詢結果整合在一個定制的Dashboard里。

原文鏈接:http://www.ctocio.com/ccnews/10394.html





















