国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

人工智能和大數據的開發過程中需要注意這12點

大數據
人工智能是近年來科技發展的重要方向,在大數據時代,對數據采集、挖掘、應用的技術越來越受到矚目。在人工智能和大數據的開發過程中,有哪些特別需要注意的要點?

[[197042]]

人工智能是近年來科技發展的重要方向,在大數據時代,對數據采集、挖掘、應用的技術越來越受到矚目。在人工智能和大數據的開發過程中,有哪些特別需要注意的要點?

人工智能領域的算法大師、華盛頓大學教授Pedro Domingos對此進行了深入思考。

在我們新近翻譯的《智能Web算法》(第2版)中,對Pedro Domingos教授的觀點進行了高度的概括,提煉出12個注意點,為行業開發實踐提供了重要參考:

注意點1:你的數據未必可靠

在實際應用中,有很多各種各樣的原因會導致你的數據是不可靠的。因此,當你將數據用于解決問題前,必須經常留心來檢查數據是否值得信賴。如果基于糟糕的數據來挖掘,無論多么聰明的人也永遠只會獲得糟糕的結果。下面列舉了一些常見的可導致數據可靠性問題的因素:

用于開發的數據,往往和實際情況下的數據分布不同。例如也許你想把用戶按照身高劃分為“高”、“中等”、“矮”三檔,但如果系統開發時使用的數據集里最低用戶的身高是6英尺(184cm),那么很有可能你開發出來的系統里會把一個“僅有6英尺”的用戶稱為“矮”用戶

你的數據集中存在很多缺失數據。事實上,除非是人為構造的數據集合,否則很難避免缺失數據問題的發生,如何處理數據缺失的問題是很有技巧的事情。實踐中我們要么是干脆丟棄一部分殘缺的數據,要么就是想辦法計算一些數值去填補這些缺失值。無論哪種方法都可能導致應用結果的不穩定

你的數據可能隨時在變化。數據庫的表結構可能會變,數據定義也可能會變

你的數據可能沒有被歸一化。假設你可能在觀察一組用戶的體重,為了能夠獲得有效的結論,首先需要對每個體重的衡量單位進行歸一化,是英鎊還是公斤,不能混淆著用

你的數據可能并不適用于相應的算法。數據存在著各種各樣的形式和規范,或者叫數據類型(data types),有些是數值化的數據,有些則不是。有些數據集合能被有序排列,有些則做不到。有些是離散化的數據(例如房間里的人數),另一些則是連續化的(例如氣溫或者氣壓等數據)

注意點2:計算難以瞬間完成

完成任何一個人工智能解決方案的計算,都需要一定的時間,方案的響應速度,對商業應用的成功與否起到十分關鍵的作用。不能總是盲目假設任何算法在所有數據集上都一定能在規定時間內完成,你需要測試下算法的性能是否在可接受的應用范圍內。

以搜索引擎為例,用戶對結果返回的時長是有忍耐的限度的。如果用戶等待的時間超過10秒,50%的用戶會流失,如果等待時間超過1分鐘,90%以上的用戶會流失。在開發智能應用系統時,不能為了達到更好的算法精度而忽略系統運算和等待的時間,否則會導致整個產品的失敗。

注意點3:數據的規模非常重要

當我們考慮智能應用時,數據規模是很重要的因素。數據規模的影響可以分為兩點來考察:第一點是規模會影響應用系統的響應速度,上一節我們剛提過;第二點是在很大的數據集上的挖掘出有價值結果的能力會受到考驗。例如為100個用戶開發的電影或音樂推薦系統可能效果很好,但是同樣的算法移植到有著100000個用戶的環境里,效果可能就不盡如人意了。

其次,使用更多的數據來訓練的簡單算法,比受制于維度詛咒(Dimension Curse)的復雜算法往往有好得多的效果。類似Google這樣擁有海量數據的大型企業,優秀的應用效果不僅來自于精妙復雜的算法,也來自于其對海量訓練數據的大規模分析挖掘。(達觀數據 陳運文)

注意點4:不同的算法具有不同的擴展能力

我們不能假設智能應用系統都可以通過簡單增加服務器的方法來擴展性能。有些算法是有擴展性的,而另一些則不行。

例如如果我們要從數億的文章標題里,找出標題相似的各個組的文章,注意并不是所有的聚類算法此時都能并行化運行的,你應該在設計系統的同時就考慮可擴展性。有些情況下你需要將數據切分成較小的集合,并能夠讓智能算法在各個集合上并行運行。設計系統時所選擇的算法,往往需要有并行化的版本,而在一開始就需要將其納入考慮,因為通常圍繞著算法還會有很多相關聯的商業邏輯和體系結構需要一并考慮。

注意點5:并不存在萬能的方法

你可能聽說過一句諺語“當你有了把榔頭的時候,看什么東西都像釘子”,這里想表達的意思是:并不存在能夠解決所有智能應用問題的萬能算法。

智能應用軟件和其他所有軟件類似——具有其特定的應用領域和局限性。當面對新的應用領域時,一定要充分的驗證原有方法的可行性,而且你最好能嘗試用全新的視角來考察問題,因為不同的算法在解決特定的問題時才會更有效和得當(達觀數據 陳運文)。

注意點6:數據并不是萬能的

根本上看,機器學習算法并不是魔法,它需要從訓練數據開始,逐步延伸到未知數據中去。

例如假設你已經對數據的分布規律有所了解,那么通過圖模型來表達這些先驗的知識會非常有效。除了數據以外,你還需要仔細的考慮,該領域有哪些先驗知識可以應用,這對開發一個更有效的分類器會很有幫助。數據和行業經驗結合往往能事半功倍。

注意點7:模型訓練的時間差異很大

在特定應用中,可能某些參數的微小變化就會讓模型的訓練時間出現很大的差異。例如在深度神經網絡訓練時就會有各種各樣的參數調節的情況發生。

人們往往會直觀地覺得調整參數時,訓練時間是基本穩定不變的。例如假設有個系統是計算地球平面上任意兩點之間的距離的,那么任意給出兩個點的坐標時,計算時間差不多都是相同的。但在另一些系統里卻并非如此,有時細微的調整會帶來很明顯的時間差異,有時差異甚至可以大到數小時,而不是數秒。

注意點8:泛化能力是目標

機器學習實踐中最普遍存在的一個誤區是陷入處理細節中而忘了最初的目標——通過調查來獲得處理問題的普適的方法。

測試階段是驗證某個方法是否具備泛化能力(generalization ability)的關鍵環節(通過交叉驗證、外部數據驗證等方法),但是尋找合適的驗證數據集不容易。如果在一個只有幾百個樣本的集合上去訓練有數百萬維特征的模型,試圖想獲得優秀的精度是很荒唐的。

注意點9:人類的直覺未必準確

在特征空間膨脹的時候,輸入信息間形成的組合關系會快速增加,這讓人很難像對中等數據集合那樣能夠對其中一部分數據進行抽樣觀察。更麻煩的是,特征數量增加時人類對數據的直覺會迅速降低。

例如在高維空間里,多元高斯分布并不是沿著均值分布,而是像一個扇貝形狀圍繞在均值附近,這和人們的主觀感受完全不同。在低維空間中建立一個分類器并不難,但是當維度增加時,人類就很難直觀的理解了。

注意點10:要考慮融入更多新特征

你很可能聽說過諺語“進來的是垃圾,出去的也是垃圾”(garbage in, garbage out),在建立機器學習應用中這一點尤其重要。為了避免挖掘的效果失控,關鍵是要充分掌握問題所在的領域,通過調查數據來生成各種各樣的特征,這樣的做法會對提升分類的準確率和泛化能力有很大的幫助。僅靠把數據扔進分類器就想獲得優秀結果的幻想是不可能實現的。

注意點11:要學習各種不同的模型

模型的組合(Ensemble)技術正變得越來越流行了,因為組合方法,僅需要付出少許偏見(bias)的代價,就能大大的減少算法的不確定性。在著名的Netflix算法競賽中,冠軍隊以及成績優異隊伍們全都使用了組合模型方法,把超過100個模型合并在一起(在模型上疊加高層的模型形成組合)以提升效果。在人工智能用于實際應用時,從業者普遍都認為,未來的算法一定時會通過模型組合的方法來獲得更好精度,但是這也會抬高非專業人員理解系統機制的門檻。

注意點12:相關關系不等同于因果關系

這一點值得反復強調,我們可以通過一句調侃的話來解釋:“地球變暖、地震、龍卷風,以及其他自然災害,都和18世紀以來全球海盜數量的減少有直接關系”。這兩個變量的變化有相關性,但是并不能說存在因果關系,因為往往存在第三類(甚至第4、5類)未被觀察到的變量在起作用。相關關系應該看作是潛在的因果關系的一定程度的體現,但需要進一步研究。

在開發人工智能與大數據應用系統時,把握好以上十二個注意點,能夠有效避免實戰中的各種“坑”,幫助技術在走出實驗室,走向落地應用時,能發揮更加健壯、強大的作用。 

責任編輯:龐桂玉 來源: 36大數據
相關推薦

2018-09-14 08:50:12

人工智能大數據

2009-06-10 15:36:25

ubuntu netb開發過程

2018-03-29 11:11:32

人工智能大數據開發

2010-07-15 14:47:05

Perl開發

2017-07-13 10:35:35

人工智能大數據開發

2017-07-24 12:48:23

人工智能大數據產品注意點

2024-05-29 08:39:19

2013-09-03 13:01:01

團隊管理團隊

2020-05-31 19:07:08

人工智能AI項目

2010-06-10 17:02:40

UML建模

2010-07-12 13:00:49

UML建模

2020-09-19 16:56:09

人工智能應用人工智能AI

2020-09-18 16:01:18

大數據

2015-09-10 09:55:36

移動web開發問題

2010-06-09 14:58:13

UML狀態圖

2010-03-04 09:54:24

Android開發

2011-03-25 14:27:40

數據庫開發程序員

2021-12-08 23:32:42

云計算云遷移數據

2011-01-26 09:40:42

.NET開發

2023-05-09 13:51:21

人工智能能源效率
點贊
收藏

51CTO技術棧公眾號

国内精品久久影院| 国产精品电影一区| 国产国产人免费人成免费视频| 婷婷激情综合| 在线观看久久久久久| 成人精品一区二区三区免费 | www.成人在线.com| 欧美日韩aaaaaa| 国产wwww| 99久久精品国产一区二区三区| 激情视频一区二区| 欧美一区二区三区激情视频| 欧美成年人视频网站| 午夜小视频在线观看| 午夜精品一区二区三区免费视频| av网站在线观看不卡| 日本欧洲一区二区| 国产伦精品一区二区三区视频孕妇 | 影音先锋欧美资源| 久久久久免费av| 欧美激情日韩图片| 女生影院久久| 欧美不卡一区二区三区四区| 美国一级片在线免费观看视频| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 成人三级视频| 欧美极品在线视频| 国产精品亚洲成在人线| 日韩电影中文 亚洲精品乱码| 黄色片在线免费观看| 亚洲人成人一区二区在线观看| 九九爱精品视频| 国产麻豆精品95视频| 五月天色一区| 日韩精彩视频在线观看| 精品日产一区2区三区黄免费 | www.国产区| 99精品欧美一区| 欧美这里只有精品| 国产成人精品亚洲午夜麻豆| 一区二区在线观| 久久av资源网| 无颜之月在线看| 国产一区二区精品久久91| 免费观看黄色的网站| 国产精品自产自拍| 亚洲美免无码中文字幕在线| 成人av在线资源| 青青草国产精品97视觉盛宴| 国内精品久久久久久久| gogo久久日韩裸体艺术| 欧美激情一区二区久久久| 精品自拍偷拍| 国产精品一区二区三区在线播放 | 综合一区在线| 亚洲va电影大全| 亚洲国产电影| 日韩精品第一页| 国产99久久久精品| 欧美伦理片在线看| 亚洲激情一二三区| 国产小视频在线播放| 欧美高清dvd| 在线手机中文字幕| 日韩视频―中文字幕| 亚洲五码在线| 国产日韩av在线| 西西人体一区二区| 91视频 - 88av| 一区免费观看视频| 国产51人人成人人人人爽色哟哟 | 99精品在免费线偷拍| 久久成人精品电影| 亚洲欧美日本伦理| 国产伦精品一区二区三毛| 免费的成人av| 午夜免费高清视频| 在线一区二区视频| 三级在线观看视频| 久久久久久美女| 亚洲无毛电影| 青青草国产精品视频| 亚洲激情自拍偷拍| 日韩另类在线| 欧美精品videosex性欧美| 婷婷另类小说| 日韩a级黄色片| 亚洲男人的天堂av| av超碰免费在线| 欧美xxxx做受欧美.88| 欧美69wwwcom| 成人在线免费观看av| 亚洲1区2区3区视频| 日韩av影片| 国产日韩欧美在线播放| 国内精品久久久久影院薰衣草 | 9l国产精品久久久久麻豆| 成人观看网站a| 欧美久久婷婷综合色| 日韩高清中文字幕一区二区| 国产激情综合五月久久| 美女视频黄 久久| 福利片免费在线观看| 日韩色在线观看| 一本色道久久综合亚洲精品酒店 | yw193.com尤物在线| 日韩中文字幕在线精品| 1024精品久久久久久久久| 女同性恋一区二区| 亚洲成人av免费| 免费视频成人| 欧美极品色图| 亚洲在线一区二区三区| 老司机成人影院| 成人欧美一区二区| 国产精品色哟哟| 亚洲精品福利电影| 国产日韩在线一区二区三区| 欧美激情在线一区二区| 久操视频在线播放| 国产精品久久久久久亚洲影视| 成人午夜在线播放| 黄av在线播放| 成人免费网视频| 国产精品色在线观看| 亚洲国产尤物| 人禽交欧美网站免费| 欧美日韩激情美女| 福利片一区二区| 国产av人人夜夜澡人人爽麻豆| 欧美日韩在线三级| 欧美一区二区麻豆红桃视频| 爆乳熟妇一区二区三区霸乳| 亚洲欧美精品suv| 日韩二区在线观看| 男同在线观看| 国产精品视频网| 国产精品不卡一区| 电影91久久久| 日韩精品一区在线视频| 日韩精品一区二区在线| 午夜亚洲福利| 最新精品视频在线| 国产精品亚洲欧美导航| 亚洲欧美怡红院| 亚洲欧美日本国产| 我的公把我弄高潮了视频| 日韩无一区二区| 99在线精品视频在线观看| 日韩精品123| 亚洲aⅴ男人的天堂在线观看| 午夜久久久久久久久久一区二区| 国产a久久精品一区二区三区| 国产一级二级在线| 国产成人aa精品一区在线播放| 成人免费一区二区三区视频 | 国产免费一区二区三区在线观看 | 自由色视频.| 国产精品免费网站| 一区二区三区四区乱视频| 色棕色天天综合网| 一级网站免费观看| 国产欧美日韩免费| 色综合一个色综合亚洲| 亚洲精品午夜av福利久久蜜桃| 国内av一区二区三区| 草莓视频一区| 欧美日韩一区二区在线视频| 午夜精品久久| 中文在线手机av| 久久久成人精品一区二区三区| 国产一区二区三区高清在线观看| 国产凹凸在线观看一区二区| 欧美系列精品| 成人拍拍拍免费视频网站| 欧美一区二区三区免费视| 亚洲色欲色欲www在线观看| 97精品国产一区二区三区| 午夜视频在线| 一区二区免费在线视频| 久久综合久久八八| 亚洲国产日韩在线一区模特| 亚洲国产欧美国产综合一区| 香蕉久久aⅴ一区二区三区| 国产玉足脚交久久欧美| 欧美黑人巨大xxx极品| 亚洲va欧美va人人爽午夜| 久久久国产亚洲精品| 久久久久黄色| 最近中文字幕在线中文视频 | 99国产精品国产精品毛片| 欧美h版在线观看| 一级片a一级片| 日韩欧美国产二区| 欧美第一页在线| 色欧美乱欧美15图片| 视频一区国产视频| 欧美成人精品一级| 黄色片在线免费看| 中国一级黄色录像|