国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Flink是如何實現批流一體的

運維 數據庫運維
實現批處理的技術許許多多,從各種關系型數據庫的sql處理,到大數據領域的MapReduce,Hive,Spark等等。這些都是處理有限數據流的經典方式。而Flink專注的是無限流處理,那么他是怎么做到批處理的呢?

[[312719]]

實現批處理的技術許許多多,從各種關系型數據庫的sql處理,到大數據領域的MapReduce,Hive,Spark等等。這些都是處理有限數據流的經典方式。而Flink專注的是無限流處理,那么他是怎么做到批處理的呢?

 

大數據干貨丨Flink是如何實現批流一體的

 

無限流處理:輸入數據沒有盡頭;數據處理從當前或者過去的某一個時間 點開始,持續不停地進行

另一種處理形式叫作有限流處理,即從某一個時間點開始處理數據,然后在另一個時間點結束。輸入數據可能本身是有限的(即輸入數據集并不會隨著時間增長),也可能出于分析的目的被人為地設定為有限集(即只分析某一個時間段內的事件)。

 

大數據干貨丨Flink是如何實現批流一體的

 

顯然,有限流處理是無限流處理的一種特殊情況,它只不過在某個時間點停止而已。此外,如果計算結果不在執行過程中連續生成,而僅在末尾處生成一次,那就是批處理(分批處理數據)。

批處理是流處理的一種非常特殊的情況。在流處理中,我們為數據定義滑 動窗口或滾動窗口,并且在每次窗口滑動或滾動時生成結果。批處理則不同,我們定義一個全局窗口,所有的記錄都屬于同一個窗口。舉例來說, 以下代碼表示一個簡單的Flink 程序,它負責每小時對某網站的訪問者計數,并按照地區分組。

  1. val counts = visits .keyBy("region") .timeWindow(Time.hours(1)) .sum("visits"

如果知道輸入數據是有限的,則可以通過以下代碼實現批處理。

  1. val counts = visits   .keyBy("region")   .window(GlobalWindows.create)   .trigger(EndOfTimeTrigger.create)   .sum("visits"

Flink 的不尋常之處在于,它既可以將數據當作無限流來處理,也可以將它當作有限流來處理。Flink 的 DataSet API 就是專為批處理而生的,如下所示。

  1. val counts = visits .groupBy("region") .sum("visits"

如果輸入數據是有限的,那么以上代碼的運行結果將與前一段代碼的相同, 但是它對于習慣使用批處理器的程序員來說更友好。

Fink批處理模型

Flink 通過一個底層引擎同時支持流處理和批處理

 

大數據干貨丨Flink是如何實現批流一體的

 

在流處理引擎之上,Flink 有以下機制:

  • 檢查點機制和狀態機制:用于實現容錯、有狀態的處理;
  • 水印機制:用于實現事件時鐘;
  • 窗口和觸發器:用于限制計算范圍,并定義呈現結果的時間。

在同一個流處理引擎之上,Flink 還存在另一套機制,用于實現高效的批處理。

  • 用于調度和恢復的回溯法:由 Microsoft Dryad 引入,現在幾乎用于所有批處理器;
  • 用于散列和排序的特殊內存數據結構:可以在需要時,將一部分數據從內存溢出到硬盤上;
  • 優化器:盡可能地縮短生成結果的時間。

兩套機制分別對應各自的API(DataStream API 和 DataSet API);在創建 Flink 作業時,并不能通過將兩者混合在一起來同時 利用 Flink 的所有功能。

在最新的版本中,Flink 支持兩種關系型的 API,Table API 和 SQL。這兩個 API 都是批處理和流處理統一的 API,這意味著在無邊界的實時數據流和有邊界的歷史記錄數據流上,關系型 API 會以相同的語義執行查詢,并產生相同的結果。Table API 和 SQL 借助了 Apache Calcite 來進行查詢的解析,校驗以及優化。它們可以與 DataStream 和 DataSet API 無縫集成,并支持用戶自定義的標量函數,聚合函數以及表值函數。

Table API / SQL 正在以流批統一的方式成為分析型用例的主要 API。

DataStream API 是數據驅動應用程序和數據管道的主要API。

從長遠來看,DataStream API應該通過有界數據流完全包含DataSet API。

Flink批處理性能

MapReduce、Tez、Spark 和 Flink 在執行純批處理任務時的性能比較。測試的批處理任務是 TeraSort 和分布式散列連接。

第一個任務是 TeraSort,即測量為 1TB 數據排序所用的時間。

TeraSort 本質上是分布式排序問題,它由以下幾個階 段組成:

(1) 讀取階段:從 HDFS 文件中讀取數據分區;

(2) 本地排序階段:對上述分區進行部分排序;

(3) 混洗階段:將數據按照 key 重新分布到處理節點上;

(4) 終排序階段:生成排序輸出;

(5) 寫入階段:將排序后的分區寫入 HDFS 文件。

 

大數據干貨丨Flink是如何實現批流一體的

 

Hadoop 發行版包含對 TeraSort 的實現,同樣的實現也可以用于 Tez,因為 Tez 可以執行通過MapReduce API 編寫的程序。Spark 和 Flink 的 TeraSort 實現由 Dongwon Kim 提供.用來測量的集群由 42 臺機器組成,每臺機器 包含 12 個 CPU 內核、24GB 內存,以及 6 塊硬盤。

 

大數據干貨丨Flink是如何實現批流一體的

 

結果顯示,Flink 的排序時間比其他所有系統都少。 MapReduce 用了2157 秒,Tez 用了1887 秒,Spark 用了2171 秒,Flink 則 只用了 1480 秒。

第二個任務是一個大數據集(240GB)和一個小數據集(256MB)之間的分布式散列連接。結果顯示,Flink 仍然是速度最快的系統,它所用的時間分別是 Tez 和 Spark 的 1/2 和 1/4.

 

大數據干貨丨Flink是如何實現批流一體的

 

產生以上結果的總體原因是,Flink 的執行過程是基于流的,這意味著各個處理階段有更多的重疊,并且混洗操作是流水線式的,因此磁盤訪問操作更少。相反,MapReduce、Tez 和 Spark 是基于批的,這意味著數據在通過網絡傳輸之前必須先被寫入磁盤。該測試說明,在使用Flink 時,系統空閑時間和磁盤訪問操作更少。

值得一提的是,性能測試結果中的原始數值可能會因集群設置、配置和軟件版本而異。

因此,Flink 可以用同一個數據處理框架來處理無限數據流和有限數據流,并且不會犧牲性能。

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2021-11-29 22:39:39

引擎Flink架構

2019-07-01 15:40:53

大數據架構流處理

2023-09-05 07:22:17

Hudi數據存儲

2022-06-30 09:30:36

FlinkSQL流批一體京東

2023-05-16 07:24:25

數據湖快手

2020-11-24 10:26:08

2024-06-25 13:08:31

2021-08-02 10:19:08

Dataphin 數倉架構存儲計算分離

2023-03-30 07:40:03

FeatHub 項目特征工程開發

2021-06-30 09:20:08

數倉FlinkHive

2022-09-29 09:22:33

數據倉

2021-11-18 21:09:50

流批場景引擎

2023-09-24 20:31:23

數字化

2019-11-29 10:02:53

AI 行業 人工智能

2019-11-28 20:51:10

阿里云Alink開源

2021-09-08 10:36:01

Flink阿里云

2021-06-11 14:01:51

數據倉庫湖倉一體 Flink

2019-12-19 14:38:08

Flink SQL數據流Join

2011-05-26 10:15:43

解析噴墨一體機

2011-04-25 17:37:38

冰雨(AWPC)ALL一體機
點贊
收藏

51CTO技術棧公眾號

免费在线成人| 成年人在线免费观看视频网站| 亚洲第一偷拍网| 久久久久久久综合色一本| 欧美日韩天堂| 亚洲1区在线| 岛国成人毛片| 1234区在线观看视频免费| 国产在线精品日韩| 国内精品模特av私拍在线观看| 欧美一区二区在线免费观看| 欧美经典一区二区三区| 美女mm1313爽爽久久久蜜臀| 久久成人综合| 国产精品视屏| 国产另类xxxxhd高清| 成人在线观看一区| 在线一级视频| 国产真实生活伦对白| 国产a级黄色大片| 狠狠久久综合婷婷不卡| 91麻豆精品秘密入口| 91av在线免费观看| 欧美日韩国产第一页| 色偷偷88888欧美精品久久久 | 黄色18在线观看| 高潮白浆女日韩av免费看| 久久久精品免费免费| 99视频有精品| 久久久久久一二三区| 日本一区二区动态图| 久久久久国产精品免费免费搜索| 99精品一区二区三区| 久久久噜噜噜久久人人看 | 久久99久久精品欧美| 美腿丝袜亚洲综合| 北条麻妃国产九九精品视频| 懂色av噜噜一区二区三区av| 国产精品一区二区在线看| 成人自拍视频在线观看| 国产性做久久久久久| 国产日本亚洲高清| 亚洲超碰精品一区二区| 精品国产31久久久久久| 欧美精品 日韩| 色伦专区97中文字幕| 97热在线精品视频在线观看| 国产日韩欧美电影在线观看| 国产精品一区二区欧美黑人喷潮水| 久久久一本精品99久久精品| 9色porny| 欧美白嫩的18sex少妇| www久久日com| 外国成人毛片| 最新国产精品| 国产综合色在线视频区| 成人高清av在线| 亚洲综合成人网| 亚洲成人中文字幕| 久久久久久久久爱| 国产一区二区视频在线免费观看| 福利在线小视频| 91se在线观看| 香蕉伊大人中文在线观看| 中文字幕视频精品一区二区三区| 亚洲v在线看| 精品无人码麻豆乱码1区2区| 欧美精品一卡| 色一区二区三区| 青青草免费观看免费视频在线| av网站网址在线观看| 亚洲一区有码| 99视频精品免费观看| 久久综合久久综合亚洲| 欧美视频在线一区二区三区| 在线精品91av| 台湾成人av| 欧美孕妇孕交| 国产精品白丝av嫩草影院| 美女网站色91| 亚洲国产成人av好男人在线观看| 亚洲欧美日韩综合| 国产欧美一区二区视频| 最新天堂中文在线| 免费男女羞羞的视频网站主页在线观看 | 国产成人日日夜夜| 精品三区视频| 九色精品国产蝌蚪| 国内成人在线| 最新高清无码专区| 亚洲人成电影网站色| 欧美lavv| 欧美日本韩国一区二区| 国产亚洲成av人片在线观黄桃| 粉嫩在线一区二区三区视频| 国产亚洲精品91在线| 久久亚区不卡日本| 国产精品成人在线观看| 欧美色另类天堂2015| 欧美日韩不卡在线| 久久九九有精品国产23| 国产精品自产拍在线观看中文| 精品一区二区三区免费毛片| 欧美少妇一区二区三区| 国产在线激情视频| av片在线观看免费| 91国内外精品自在线播放| 免费一区二区三区在线视频| 西野翔中文久久精品字幕| 欧美在线不卡| wwwwxxxxx欧美| 久久亚洲精华国产精华液| 久久久久成人黄色影片| 91黄色激情网站| 精品三级av在线| 91探花福利精品国产自产在线| av黄色免费在线| 亚洲精品a区| 一区二区三区在线观看视频| 热草久综合在线| jizzjizzxxxx| 在线观看麻豆蜜桃| 给我免费播放日韩视频| 日本亚洲一区二区| 专区另类欧美日韩| 中文字幕不卡在线视频极品| 成人字幕网zmw| 污污软件在线观看| 免费一区二区三区视频导航| 亚洲深爱激情| 欧美中文字幕不卡| 51蜜桃传媒精品一区二区| 91网在线播放| 日韩国产欧美在线视频| 精品粉嫩超白一线天av| 性一交一乱一伧国产女士spa| 在线播放成人| 免费成人你懂的| 久久久av网站| 精品一区二区成人免费视频| av影视在线看| 成人激情免费网站| 久久久久久久久综合| 亚洲三级视频网站| 色婷婷狠狠五月综合天色拍| 亚洲欧美日韩国产综合在线| 欧美高清一级大片| 91精品福利在线一区二区三区| 欧美人在线观看| 久久mv成人精品亚洲动漫| 久草成人资源| 欧美性大战久久| 精品蜜桃传媒| а√天堂官网中文在线| 欧美1区视频| 欧美午夜理伦三级在线观看| 日本10禁啪啪无遮挡免费一区二区| 人妖欧美1区| 91蜜桃网址入口| 国产精品爽爽ⅴa在线观看| 欧美四级在线| 国产成人高清视频| 中文字幕精品一区二区精品| 天堂av中文在线资源库| 国产精品观看| 亚洲精品短视频| 日韩欧美在线番号| 亚洲成人国产| 亚洲国产中文字幕在线观看| 成人性免费视频| 少妇视频在线观看| 国产91在线|亚洲| 国产日韩精品在线| 精品国产一区二区三区久久久蜜臀| 成人欧美一区二区三区白人| 亚洲在线欧美| 国产日产一区| 欧美freesex8一10精品| 91在线视频在线| 国产自产精品| 精品国产影院| 精品视频久久久| 性疯狂做受xxxx高清视频| 国产精品国产三级国产普通话三级 | 国产在线无码精品| av免费在线免费| 久久婷婷色综合| 亚洲综合中文字幕68页| 亚洲精品一区| 日本韩国一区二区| 少妇人妻互换不带套| 日韩精品福利网| 国产精品一区久久| 国内精品久久久久久99蜜桃| 国产一区二区三区在线观看视频| 黄色一级一级片| 国产麻豆视频一区| 国产91精品一区二区绿帽| 国产精品久久久久久久久久白浆| 精品久久久久久久大神国产|