国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大數據謬誤 —— 為什么我們需要收集更多的數據

云計算
Michael Wu博士從人們對大數據的誤解入手,詳細的分析了數據與信息的不同。并提出了:雖然大數據的作用被夸大了,但是人們卻是要更加的重視大數據。只有收集更多的數據,才會有更多的機會得到有價值的見解,從而做出正確的決策取得領先。

[[98958]]

Michael Wu(博士) —— Lithium首席科學分析師,為Lithium提供社交網絡數據復雜性探索和理解的方法。

數據的價值等同于從中挖掘到的信息和見解;并根據它們做出正確的決策,從而獲得一定的競爭優勢。而我們對于大數據的期望也是收集足夠多的信息并獲得有價值的見解。然而人們還沒有意識到數據和信息的不同 —— 你從海量數據中提取到的信息并不一定都有意義和價值。

數據不等于信息

許多人口中的數據和信息都是等價的,然而兩者之間卻有著很微妙的區別。數據只是事情發生的簡單記錄,它只是記錄了事情發生的時間、地點以及涉及人物的原始數據。是的,數據中確實包含著大量的信息。

這也正是對大數據理解的謬誤所在:大數據雖然給你帶來了大量的信息,但是數據的增長卻沒有帶來成比例的信息增長。實際的情況就是:收集的數據越多,從中提取到的信息比例越低。這就意味著隨著數據體積激增,你從中提取到信息比例會逐漸的縮減。雖然聽起來很不可思議,但是事實就是這樣的。下面來看一些例子:

例1:數據的備份和復制。如果你認真查看你的電腦,你會發現:這些年的使用,你創建了成千上萬的文件。不論它們是如何產生的(拍的照片、寫的博客或者是發送的電子郵件),其中必然包含著一定數量的信息。這些文件儲存在你的硬盤中,并占用一定的空間。

事情發生了:不出意外,你一定會定期的給數據做備份。這里我們可以想象一下在第一次給硬盤做備份中花掉的時間。單純針對數據的本身而言,你已經擁有雙倍量的數據了。如果你備份之前擁有50GB數據,那么備份以后你則擁有了100GB。然而經過了備份,你就可以獲得雙倍的信息量了?結果是否定的。事實上完成這個操作以后你沒有額外的獲得任何信息,因為備份中的文件和初始磁盤上的文件包含的信息是完全相同的。

盡管我們的私人數據和大數據不搭邊,但是這個例子卻闡明了數據和信息之間微妙的差別。下面我們來看一下涉及到更大體積數據的例子。

例2:機場視頻監視記錄。首先,視頻文件已經是相當之大了;其次,機場使用的是24/7閉路式監測系統,而HD設備會進一步增加數據的體積;最終,機場可能擁有成千上萬的攝像頭。如你所見,這些檢測攝像頭記創建的視頻記錄可以輕松的獲得“大數據”的資格。

不妨設想一下如果我們把攝像頭的數量提升兩倍會發生什么 —— 雙倍體積的數據。然而很顯然你可能還是得不到雙倍的信息。有許多的監視設備拍到的東西都是重復的,可能會有一些微小的區別 —— 不同的地區在些許不同的時間內會拍到完全不同的畫面。在信息量這個方面,我們可能永遠都得不到2倍。而且隨著監視設備的增加,信息重疊的可能性也會隨之增高。這就是為什么隨著數據的增加,信息的收益卻在減少 —— 其中的冗余越來越多。

用不等式表達就是:信息 ≤ 數據。所以信息不應該是數據,而是沒有冗余的數據。這也是為什么給數據備份卻無法增加信息量的原因,因為拷貝是冗余的。

例3:社交渠道的更新。那么社交中的大數據又是什么情況呢,比如:Twitter。對比平時我們不妨多推特一倍的內容,那么Twitter肯定會獲得兩倍的數據。但是Twitter有獲得兩倍的信息嗎?很顯然沒有,決定信息量的是你推特的內容而不是次數。當然如果我們推特的內容是完全無冗余的,那么Twitter毫無疑問的將獲得雙倍的信息。但是這永遠都不可能發生!我們來看一下其中的原因:

首先,我們會相互轉發。因此在互相的轉發中,會產生很多冗余;即使我們拒絕轉發,而在同一時間發布同樣內容的幾率也是很高的,因為使用Twitter的人太多了。雖然每個推特使用的措辭可能會完全不同,但是包含相同網絡內容的不同推特所(可能是條博客、很酷的電影或者爆炸性新聞)所造成的冗余是非常高的。此外,一段時間內我們很可能對同類的新聞感興趣。因為我們推特的內容更趨向于我們的品味和興趣,所以同一個人推特不同的內容都會存在一些冗余。

所以很清楚的看到:即使對比平時我們多推特了一倍的內容,卻因為中間存在著相當多的冗余導致Twitter不會獲得雙倍的信息。此外我們還會通過不同的渠道獲得相同的內容,但是因為僅僅是拷貝我們不會多獲得任何信息。

所以盡管數據會帶來信息,但是數據不等于信息。信息只是數據中不重復的部分。這樣的話,我們從數據中提取到信息只占數據總量的一小部分。

所以雖然理論上信息是小于等于數據的,但是現實中往往是信心遠小于數據。因此大數據可以捕捉大量信息的想無疑是天真和不切實際的,大數據的價值完全被夸大了。  

 

 #p# 

 

信息不等于見解

盡管我們從大數據中提取的信息量有可能被高估了,但是從大數據中獲得的見解仍然是極其寶貴的。那么信息和見解兩者又有著是什么樣的關系呢?所有的見解都源于信息,但是不代表所有的信息都可以提供見解。對于能給出有價值見解的信息,我們有3個標準:

首先,可解釋的。因為大數據包含如此多的非結構化數據和不同的媒體類型數據,導致其中大量的數據和信息都不可解釋。

舉個例子:123,243,187,89,157這組數據,它們能代表什么?它可能是你在TechCruncn上讀過前五篇文章的like數目,也可能是一個黑白圖像上5個像素點的亮度。沒有更多的信息和元數據,是無法解釋這樣的數據的。因此不能解釋的數據和信息是不會給你提供任何見解的 —— 見解只存在于提取出信息中的可解釋部分。

其次,關聯性。必須是和用途與價值緊密相關的信息。相關的信息通常被看作是信號,而不相關的則被作為噪音。然而關聯性有著相當的主觀成分,對一個人很重要的信息可能完全和另一個人無關。這也是Edward Ng(一個著名的數學家)說過的:“一個人的的信號恰好是另一個人的噪音。”

此外,關聯還不僅是主觀的;同樣是前后聯系的。關聯還可能是人從一個環境中換到了另一個。打個比方:如果我下星期將要去NYC的話,那么NYC的交通將會關聯到我。但是當我回到SF,那么同樣的信息將會和我有關聯。因此見解又是關聯信息中一個非常小的子集,這里別忘記相關信息已經是可解釋信息中非常小的一個子集。

最后,得是“新出爐”的。必須是有遠見的信息。這就意味著它必須提供一些你以前不曾擁有的新知識。

顯然這個標準也是主觀的。因為一個人知道的東西另一個人不一定也知道,而新鮮也是因人而異的。這種主觀性中有一部分繼承于關聯的主觀性。如果有些信息和你是關聯的,而且之前又并不知道;那么當你去學習的時候,它將是新的。假如這個信息和你沒有關系的話,那么再新奇你也不可能想去了解它。這樣的話這些信息對你來說就是毫無價值的。

然而這個見解一旦被你獲知,那么當下次你獲得的時候就不會再覺得那么新奇和深刻。因此隨著我們不斷的從大數據中捕獲知識,新的見解就越來越難以發現。那么見解這個關聯信息中的子集又將繼續縮減。

在見解這個子集層層的縮減后,就會發現大數據的價值被徹底的夸大了。當然這里不是說大數據是沒有價值的,只是說它的價值被夸大了,因為發現有價值見解的可能性非常小。

這樣來看大數據可能會讓人失望,但是這同樣是我們需要大數據的理由!因為從數據中獲得的見解越來越少,所以我們必須收集越來越多的數據讓我們擁有更多的機會獲得見解。雖然更多的數據也不能保證一定會揭露許多有價值的見解,但是增加數據量無疑會增加我們獲得見解的機會。

責任編輯:王程程 來源: TechCrunch
相關推薦

2022-08-31 15:40:13

云原生數據

2013-01-07 11:31:11

大數據大數據應用

2013-01-08 10:19:35

大數據數據分析大數據全球技術峰會

2015-01-07 14:04:25

2020-02-19 15:01:30

數據庫SQL技術

2014-07-02 09:56:33

2024-04-11 13:18:44

AIGCAGI技術

2023-06-28 10:22:50

數據中心服務器

2020-07-22 11:41:14

數據架構大數據技術

2023-09-05 09:49:03

2018-09-14 18:00:29

無損網絡

2022-08-26 08:00:19

企業架構IT

2019-08-05 08:42:37

物聯網IOT技術

2025-06-24 02:00:00

5G-A運營商基站

2020-04-06 14:45:22

云計算邊緣計算網絡

2022-12-01 14:43:56

物聯網智慧城市

2015-10-09 16:14:37

數據開放

2012-11-08 09:32:24

2018-05-30 14:49:51

編程語言API語法

2020-11-17 07:55:22

大數據殺熟
點贊
收藏

51CTO技術棧公眾號

日韩伦理福利| 国产精品日韩久久久久| 美女av免费观看| 欧美日韩一卡| 日韩综合中文字幕| 18视频在线观看| 狠狠综合久久av一区二区小说| 狠狠热免费视频| 国产a精品视频| 国产日韩欧美二区| 日韩电影在线视频| 欧美伊久线香蕉线新在线| 国产精品蜜月aⅴ在线| 日韩精品一区二区三区在线| 国产中文在线| 色综合久久久久久久久久久| 米奇在线777| 亚洲欧洲美洲综合色网| 九色porny91| 国产日韩一级二级三级| 久久综合久久色| 26uuu亚洲综合色| 欧美日韩在线一| 成人av资源站| 欧美女人性生活视频| caoporen国产精品视频| 无颜之月在线看| 国内精品免费在线观看| 伊人天天久久大香线蕉av色| 国产一级久久| 日本不卡一区二区三区在线观看| 激情欧美一区二区三区| 国产自产在线视频一区| 亚洲欧美激情诱惑| 先锋影音亚洲资源| 精品一区二区免费| 青青在线视频免费观看| 国产福利一区二区| 免费在线激情视频| 国产精品私房写真福利视频| 免费观看视频www| 日韩美女视频一区| а√最新版地址在线天堂| 精品久久久久久久中文字幕| 伪装者在线观看完整版免费| 亚洲成av人片在线观看| 国产粉嫩一区二区三区在线观看| 欧美色手机在线观看| 日韩123区| 日韩在线播放视频| 香蕉久久精品| 91久久嫩草影院一区二区| 99国产精品久久久久久久成人热| 日本一区二区三区四区在线观看| 国产美女一区二区三区| 久草综合在线观看| 婷婷国产在线综合| 丰满的护士2在线观看高清| 俺也去精品视频在线观看| 偷拍自拍一区| 国产偷国产偷亚洲高清97cao| 免费一区二区视频| 成人综合视频在线| 激情亚洲一区二区三区四区| 男男gaygays亚洲| 理论片在线不卡免费观看| 日韩激情免费| 亚洲欧美在线网| 亚洲欧洲韩国日本视频| 国产区视频在线播放| 亚洲色在线视频| 精品中文一区| 亚洲啪啪av| 中文字幕电影一区| 日韩三级影院| 另类图片亚洲另类| 国内综合精品午夜久久资源| www.xxx麻豆| 亚洲6080在线| 精品欧美一区二区三区在线观看| 日韩女优在线播放| 欧美精品激情| 一二三四视频社区在线| 91成人国产精品| 精品精品视频| 国内视频一区| 国产视频一区二区在线| 日本在线免费网| 欧美激情乱人伦| 麻豆精品91| 色av一区二区三区| 中文字幕日韩在线视频| 亚洲精品1区| 丁香六月婷婷| 色偷偷噜噜噜亚洲男人的天堂| 国内视频精品| av网站观看| 中文字幕亚洲综合久久筱田步美| 欧美不卡视频| 男人女人黄一级| 欧美一区二区大片| 在线日韩一区| 欧美深夜福利视频| 日韩视频在线你懂得| 日韩片欧美片| 俄罗斯av网站| 日韩欧美国产不卡| 久久一区二区三区喷水| 成年人网站国产| 制服视频三区第一页精品| 久久av网址| 国产精品无码专区av在线播放| 精品国产青草久久久久福利| 久久一区二区中文字幕| 国产亚洲综合视频| 亚洲免费小视频| 精久久久久久| 尤物免费看在线视频| 久久久在线视频| 国产白丝网站精品污在线入口| 二区在线观看| 成人福利网站在线观看11| 国产精品国产成人国产三级| 国产综合色激情| 日韩福利影院| 欧美久久一二三四区| 亚洲五月综合| 五十度飞在线播放| 26uuu国产精品视频| av电影一区二区| 日韩高清成人| 制服国产精品| 日韩不卡在线观看| 久久精品综合| 国产区在线观看| 六月婷婷久久| 精品视频在线免费观看| 91精品国偷自产在线电影| 国产精品㊣新片速递bt| 国产精品video| 午夜久久久久久久久| 日韩精品欧美| 日本成人一区| 国产91精品入口17c| 欧美日韩一区二区三区四区五区| 精品1区2区3区4区| 久热国产在线| 亚洲一区二区三区涩| 精品视频一区在线视频| 精品在线一区二区| 欧美亚洲大片| 91av在线免费播放| 97精品免费视频| 亚洲成人黄色影院| 亚洲手机视频| аⅴ资源天堂资源库在线| av影院在线播放| 亚洲人成绝费网站色www| 99精品视频一区| 极品束缚调教一区二区网站| www.大网伊人| 亚洲自拍小视频免费观看| 欧美三区免费完整视频在线观看| 裸体一区二区| 国产 日韩 欧美一区| 热久久精品免费视频| 国产精品91免费在线| 欧美日韩国产麻豆| 久久www成人_看片免费不卡| 黄页网站大全在线免费观看| ijzzijzzij亚洲大全| 久久精品视频亚洲| 中文字幕一区三区| 亚洲草久电影| 欧美14一18处毛片| 国产超级av在线| 国产一区视频在线| 精品三级在线看| 99热这里都是精品| 久草在线成人| bestiality新另类大全| 男女猛烈激情xx00免费视频| 91高清视频在线免费观看| 色婷婷综合久久久久中文| 九一九一国产精品| 国产精品45p| 国产三级在线播放| 人妻内射一区二区在线视频| 91在线精品视频| 精品丝袜一区二区三区| 亚洲欧美一区二区视频| 国产亚洲成人一区| 91嫩草国产线观看亚洲一区二区| 在线看视频你懂的| 日本福利视频在线观看| 国产精品视频免费在线| 亚洲人成在线电影| 日韩欧美一区二区在线| 成人黄色网址在线观看| 欧美在线三级|