Facebook開放圖譜:如何從9億用戶數(shù)據(jù)里找猛料
Facebook 平臺有6年歷史了,公司借用它的開放圖譜正在不斷擴張,如今有900萬個應(yīng)用借助這個開放圖譜在社交網(wǎng)絡(luò)平臺上分一杯羹,而最近Viddy、SocialCam、VEVO等借助開放圖譜獲得大量用戶,也說明了開放圖譜的價值。
開放圖譜介紹:
1. 本質(zhì)上,開放圖譜是一種方式,它抓取Facebook用戶在第三方服務(wù)上的數(shù)據(jù),然后反饋給Facebook 機器。這樣它就可以向所有在線的朋友分享全部的信息。比如數(shù)字音樂服務(wù)Spotify, 你跟你Facebook的朋友分享你喜歡的Spotify音樂,這些小碎片全部匯集到Facebook動態(tài)更新, 然后到Facebook時間線,最后這個碎片會影響你的其它Facebook朋友。
Facebook超過9億用戶每天都會產(chǎn)生大量數(shù)據(jù),但Facebook不能把所有的信息碎片顯示在你的新聞動態(tài)中,開放圖譜讓應(yīng)用和網(wǎng)站開發(fā)者構(gòu)建他們的數(shù)據(jù),這樣Facebook機器可以重新分類并有目的性的利用這些數(shù)據(jù)。
2. Facebook的開放圖譜總負責人Mike Vernal表示:“我們可以借助傳統(tǒng)的文本分析來得出結(jié)果, 但最后還是決定建立一個構(gòu)架:開發(fā)者能夠明確告訴我們他應(yīng)用的相關(guān)信息,這樣方便我們快速提煉出更有趣,更直觀的信息。”
應(yīng)用開發(fā)者在自己的網(wǎng)站上構(gòu)建數(shù)據(jù)庫,F(xiàn)acebook就在開放圖譜上構(gòu)建這些應(yīng)用。前Myspace母公司Fox Interactive員工Adrian Aoun認為:“Facebook之所以能打敗Myspace, 就是因為它能夠有效地管理數(shù)據(jù),而且條理清楚。”

在開放圖譜怎樣甄選數(shù)據(jù):
Facebook儲存著兩種數(shù)據(jù):目標數(shù)據(jù)和描述目標數(shù)據(jù)關(guān)系的數(shù)據(jù);
1. “在系統(tǒng)的頂層我們支持開發(fā)者定義他們的目標數(shù)據(jù),然后像整理一般用戶信息一樣對開發(fā)者目標數(shù)據(jù)進行歸類。”
系統(tǒng)主要從兩部分工作:1. 分析什么內(nèi)容能讓Facebook聽眾感興趣。2. 基于第一個分析出的結(jié)果分析什么內(nèi)容對你是特別重要的。然后我們匯總這兩個分析,決定新聞動態(tài)系顯示什么,時間線顯示什么,其他相關(guān)的系統(tǒng)顯示什么。
2. “在網(wǎng)頁上,我們試圖分析你在尋找什么, 比如Obama有3000萬粉絲, 如果你訪問他的主頁,我們會提示你的哪些朋友也喜歡他,我們做這個只需要幾毫秒。”
當用戶在Facebook上這里點擊,那里點擊的時候, 軟件平臺Scribe正在實時記錄這些數(shù)據(jù),另外一個接入Scrible的平臺正在進行實時分析,得出什么是最受歡迎的,什么是最不受歡迎的。這些記錄會被儲存在另一個數(shù)據(jù)庫里,然后顯示在新聞動態(tài),時間線里。Vernal 表示,數(shù)據(jù)從一個系統(tǒng)移到另一個系統(tǒng)耗時20-30秒,每個小時有數(shù)億的轉(zhuǎn)移行為在發(fā)生。所以才保證了Facebook這個開放圖譜的高速運行。
【編輯推薦】
























