国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

網(wǎng)易數(shù)帆開源Arctic:推動(dòng)湖倉一體落地,驅(qū)動(dòng)業(yè)務(wù)價(jià)值

原創(chuàng)
大數(shù)據(jù)
當(dāng)我們將數(shù)據(jù)湖的能力拓展到實(shí)時(shí)場景,成本、性能和數(shù)據(jù)新鮮度三者的關(guān)系將呈現(xiàn)更為復(fù)雜和微妙的狀態(tài),Arctic的服務(wù)和管理功能,將為用戶和上層平臺理清這個(gè)三角關(guān)系。

數(shù)字時(shí)代,數(shù)據(jù)呈現(xiàn)出了大規(guī)模、多樣性、極速增長的態(tài)勢,同時(shí),企業(yè)對數(shù)據(jù)處理分析的實(shí)時(shí)性和融合性提出了更高的要求,數(shù)據(jù)應(yīng)用場景正在向復(fù)雜化、多元化轉(zhuǎn)變,從最初的交易場景,到分析場景,再到混合場景、復(fù)雜分析場景,再到如今的實(shí)時(shí)混合場景,隨之而來的是大數(shù)據(jù)架構(gòu)在一直不斷地演進(jìn)。從數(shù)據(jù)庫、數(shù)據(jù)倉庫、數(shù)據(jù)湖,到現(xiàn)在 “湖倉一體(Lake House)”的概念應(yīng)運(yùn)而生。

根據(jù)DataBricks公司的定義,湖倉一體是一種結(jié)合了數(shù)據(jù)湖和數(shù)據(jù)倉庫優(yōu)勢的新范式,在用于數(shù)據(jù)湖的低成本存儲上,實(shí)現(xiàn)與數(shù)據(jù)倉庫中類似的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)管理功能。湖倉一體是一種更開放的新型架構(gòu),它打通了數(shù)據(jù)倉庫和數(shù)據(jù)湖,將數(shù)據(jù)倉庫的高性能及管理能力與數(shù)據(jù)湖的靈活性融合了起來,底層支持多種數(shù)據(jù)類型并存,能實(shí)現(xiàn)數(shù)據(jù)間的相互共享,上層可以通過統(tǒng)一封裝的接口進(jìn)行訪問,可同時(shí)支持實(shí)時(shí)查詢和分析,為企業(yè)進(jìn)行數(shù)據(jù)治理帶來了更多的便利性。

目前國內(nèi)外同行將 delta、iceberg 和hudi 作為數(shù)據(jù)湖 table format 的對標(biāo)方案。delta的推出是為了解決傳統(tǒng)數(shù)據(jù)湖在事務(wù)處理、流計(jì)算、BI 分析上的不足。從功能上看,iceberg和delta幾乎一樣,但是iceberg似乎更加符合一個(gè)開源項(xiàng)目的氣質(zhì)。早期這個(gè)項(xiàng)目更多是為了應(yīng)對 Netflix 對大體量數(shù)據(jù)分析的需求。hudi 開源和孵化的時(shí)間線與 iceberg 比較相近,核心功能是在 hadoop 上支持 upsert 和 incremental process。hudi 在三個(gè)項(xiàng)目中最早提供 stream upsert 能力 ,如果不做二次開發(fā),hudi 是開箱即用的數(shù)據(jù)湖 upsert 方案,并且 hudi 社區(qū)對開發(fā)者非常開放。

企業(yè)需要怎樣的數(shù)據(jù)湖?

面對眾多的數(shù)據(jù)湖,企業(yè)究竟需要怎樣的產(chǎn)品?這個(gè)問題可以從Delta的身上看出端倪。“ Delta用一套數(shù)據(jù)湖存儲,將批計(jì)算和流計(jì)算融合,將傳統(tǒng)數(shù)倉在數(shù)據(jù)分析上的優(yōu)勢,數(shù)據(jù)湖在 AI,數(shù)據(jù)科學(xué)上的優(yōu)勢結(jié)合起來,基于 Lakehouse 這個(gè)存儲底座,實(shí)現(xiàn)數(shù)據(jù)業(yè)務(wù)的全場景覆蓋。總結(jié)起來就是,Delta 給 Databricks 帶來的價(jià)值是用一套基礎(chǔ)數(shù)據(jù)湖軟件,實(shí)現(xiàn)全場景覆蓋。”網(wǎng)易數(shù)帆大數(shù)據(jù)實(shí)時(shí)計(jì)算技術(shù)專家、湖倉一體項(xiàng)目負(fù)責(zé)人馬進(jìn)表示。

另一方面,國內(nèi)實(shí)時(shí)計(jì)算基本在用 Flink,而絕大多數(shù)企業(yè)不會(huì)綁定一個(gè)計(jì)算引擎,所以引擎平權(quán)對數(shù)據(jù)湖極為重要。不同引擎的應(yīng)用可以吸收各家優(yōu)勢,但會(huì)帶來產(chǎn)品割裂的問題,產(chǎn)品割裂在大數(shù)據(jù)方法論的迭代中被更加放大,比如在數(shù)據(jù)中臺中,指標(biāo)系統(tǒng),數(shù)據(jù)模型,數(shù)據(jù)質(zhì)量,數(shù)據(jù)資產(chǎn)這一套中臺模塊基本是圍繞離線場景打造,而在強(qiáng)調(diào) CI/CD 的 Dataops 中,流計(jì)算的需求和場景因?yàn)榇鎯陀?jì)算的不統(tǒng)一更加難以被納入考量。

應(yīng)對之策就是實(shí)時(shí)數(shù)倉--流計(jì)算對應(yīng)的場景和需求在大數(shù)據(jù)平臺的方法論迭代中被邊緣化,用戶無法在實(shí)時(shí)場景下體驗(yàn)到數(shù)據(jù)安全,數(shù)據(jù)質(zhì)量,數(shù)據(jù)治理帶來的收益,很多既需要實(shí)時(shí)也需要離線的場景下,用戶需要維護(hù)流表和批表兩套模型,兩套代碼,并且時(shí)刻警惕語義和模型的二義性。

立足于開源數(shù)據(jù)湖 Format之上,打造Arctic

過去兩年,網(wǎng)易數(shù)帆的團(tuán)隊(duì)開發(fā)了 Arctic項(xiàng)目,并且在今年7月底開源。“我們的工作不是另起爐灶,做一個(gè)跟 delta/iceberg 競爭的產(chǎn)品,這不符合企業(yè)的需求,Arctic 是立足于開源數(shù)據(jù)湖 Format之上的服務(wù),基于 iceberg的產(chǎn)品。”馬進(jìn)表示。“我們的目標(biāo)要將 Dataops 的邊界拓展到流計(jì)算,所以 Arctic 會(huì)為用戶提供更加優(yōu)化的流的能力,包括 stream upsert、生產(chǎn)可用的讀時(shí)合并技術(shù)、提供分鐘級別新鮮度的數(shù)據(jù)分析能力。”簡而言之,Arctic 是適配多引擎的流式湖倉服務(wù)。

Arctic作為服務(wù)可以適配不同的數(shù)據(jù)湖格式,企業(yè)無需擔(dān)心數(shù)據(jù)湖技術(shù)的選型問題,持續(xù)優(yōu)化數(shù)據(jù)分析能力,也讓數(shù)據(jù)流管理變得簡單;在能力上,Arctic不僅提供了基于主鍵高效地流式更新,數(shù)據(jù)自動(dòng)分桶、結(jié)構(gòu)自優(yōu)化的特性,還支持將數(shù)據(jù)湖和消息隊(duì)列封裝成統(tǒng)一的表,實(shí)現(xiàn)比傳統(tǒng)方案更低延遲的流批一體,從根本上優(yōu)雅地解決性能問題。另一方面,Arctic還提供流式數(shù)倉標(biāo)準(zhǔn)化的度量,dashboard 和相關(guān)管理工具,并為流批并發(fā)寫入提供事務(wù)性保障;在架構(gòu)上,Arctic設(shè)計(jì)簡潔,只有AMS、optimizer和dashboard三個(gè)組件,在數(shù)據(jù)湖和計(jì)算引擎之間提供湖倉一體落地所需的能力,但卻支持Spark和Flink讀寫、Trino查詢,百分百兼容Iceberg/Hive的表格式和語法,這使得它的使用成本很低。

“當(dāng)我們將數(shù)據(jù)湖的能力拓展到實(shí)時(shí)場景,成本、性能和數(shù)據(jù)新鮮度三者的關(guān)系將呈現(xiàn)更為復(fù)雜和微妙的狀態(tài),Arctic的服務(wù)和管理功能,將為用戶和上層平臺理清這個(gè)三角關(guān)系。”馬進(jìn)強(qiáng)調(diào)。

打造成熟的湖倉管理系統(tǒng)

馬進(jìn)認(rèn)為,流式湖倉未來最終是要在產(chǎn)品上體現(xiàn),和整個(gè)產(chǎn)品上層的方法論結(jié)合在一起。如果只是把流式湖倉當(dāng)成另外一種分析平臺,或者是對標(biāo)像Kudu、Doris對標(biāo)的方案,意義不大,或收益有限,其最終收益應(yīng)該結(jié)合數(shù)據(jù)建設(shè)方法論來看。

對于Arctic的發(fā)展方向,網(wǎng)易數(shù)帆團(tuán)隊(duì)希望其向一個(gè)成熟的湖倉管理系統(tǒng)過渡。就像在數(shù)據(jù)庫領(lǐng)域的Oracle、MySQL、DB2等系統(tǒng),它們不光是數(shù)據(jù)庫,還是一套管理系統(tǒng),包括information schema、各種各樣標(biāo)準(zhǔn)化管理和度量的工具,共同為上層工具和用戶服務(wù)。比如上層要做數(shù)據(jù)庫的工具,就會(huì)用標(biāo)準(zhǔn)化的命令或者SQL,與數(shù)據(jù)庫交互就可以了。“我認(rèn)為這是一個(gè)成熟的管理系統(tǒng)需要具備的能力。”馬進(jìn)表示。

總之,Arctic的未來一方面要補(bǔ)足底層的短板,包括性能和可靠性,以及持續(xù)優(yōu)化的能力。另一方面,是要提高它在管理上的標(biāo)準(zhǔn)化能力,比如table service能力,optimizing過程管理能力,進(jìn)而形成一個(gè)成熟的管理系統(tǒng)。


責(zé)任編輯:趙立京 來源: 51CTO
相關(guān)推薦

2022-08-11 18:07:35

網(wǎng)易數(shù)帆華泰證券Arctic

2022-12-13 17:42:47

Arctic存儲湖倉

2023-06-28 07:28:36

湖倉騰訊架構(gòu)

2023-12-14 13:01:00

Hudivivo

2021-06-07 11:22:38

大數(shù)據(jù)數(shù)據(jù)倉庫湖倉一體

2022-11-10 08:48:20

開源數(shù)據(jù)湖Arctic

2022-11-07 18:19:14

Arctic大數(shù)據(jù)

2023-08-30 07:14:27

MaxCompute湖倉一體

2024-09-03 14:59:00

2022-09-29 09:22:33

數(shù)據(jù)倉

2022-07-29 15:02:26

巨杉數(shù)據(jù)庫湖倉一體

2025-08-21 09:29:11

2023-06-19 07:13:51

云原生湖倉一體

2022-08-19 19:13:52

Arctic開源

2021-07-07 10:13:56

大數(shù)據(jù)Delta Lake 湖倉一體
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

免费日韩电影在线观看| www.欧美免费| 亚洲精品影片| 国产精品.com| 91麻豆精品国产无毒不卡在线观看| 999色成人| 六十路精品视频| 婷婷国产在线综合| 亚洲精品无播放器在线播放| 日韩第一页在线观看| 亚洲国产成人av| 日韩精品欧美激情| 奇米精品一区二区三区| 国产拍在线视频| www.欧美精品| 久久丁香综合五月国产三级网站 | 人人狠狠综合久久亚洲婷婷| 日本中文字幕一级片| 欧美综合在线第二页| 日韩欧美成人免费视频| 日韩成人免费电影| 伊人精品视频| 国产乱妇乱子在线播视频播放网站| 麻豆91蜜桃| 精品日韩一区二区三区| 国产欧美日韩另类视频免费观看| 国产中文字幕在线观看| 亚洲影视九九影院在线观看| 久久精品国产欧美亚洲人人爽| 日韩电视剧免费观看网站| 国产婷婷色综合av蜜臀av| 欧美日韩国产另类一区| 日韩亚洲欧美在线观看| 精品捆绑美女sm三区| 欧美性生活大片免费观看网址| 久久久久高清精品| 久久久久一区| 99热精品久久| 偷拍自拍一区| julia一区二区三区中文字幕| 亚洲精品视频99| 国产精品二区在线| 欧美激情精品久久久久久免费印度 | 91在线观看污| 欧美做受69| 精品久久av| 在线免费一区| 亚洲欧美另类小说| 狠狠操综合网| missav|免费高清av在线看| 瑟瑟视频在线| 国产网红女主播精品视频| 日韩午夜视频在线| 久久麻豆视频| 亚洲国产欧美在线观看| 亚洲成人一区| 精品中文av资源站在线观看| 视频在线观看国产精品| 99精品视频在线观看免费| 26uuu久久天堂性欧美| 国产69精品久久99不卡| 国产亚洲精品v| 日韩av中文字幕一区| 高清久久一区| 91福利区在线观看| 日本综合在线| 午夜成人影视| 久久成人福利视频| 久久99精品久久久水蜜桃| 国产精品久久久久久久久久久久午夜片| 精品在线视频一区二区三区| 日韩人体视频一二区| 国产日产亚洲精品系列| 久久精品成人| 九九**精品视频免费播放| jlzzjlzz亚洲日本少妇| 尤物在线网址| 激情丁香在线| 天天干天天玩天天操| 日本一二三区视频在线| 在线丝袜欧美日韩制服| 亚洲午夜精品一区二区| 国产精品区一区| 午夜精品视频在线| 一本一道久久a久久精品逆3p| 亚洲精品久久久久久下一站| 日韩久久久精品| 欧美性一二三区| 中文字幕在线观看不卡视频| 国产精品99久久久久久有的能看| 99精品国产在热久久婷婷| 国产麻豆精品久久| 精品五月天堂| 日本综合精品一区| 在线成人动漫av| 亚洲69av| 国产精品一线| 99re6热只有精品免费观看| 亚洲精品观看| 久久av超碰| 在线天堂新版最新版在线8| 在线免费看h| 99久久999| 欧美激情网址| 国精品一区二区| 欧美伊人久久| 日韩国产精品91| 国产福利精品导航| 久久久久青草大香线综合精品| 中文字幕视频一区| 欧美日韩国产成人在线免费| 亚洲最新av网址| 欧美裸体男粗大视频在线观看| 久久久久久久久久av| 国产午夜精品免费一区二区三区| 欧美日韩午夜视频在线观看| 亚洲一区二区在线免费观看视频 | 一本久道久久综合狠狠爱亚洲精品| 久久久水蜜桃| 日韩三级电影网站| 131美女爱做视频| 国产精品乱码久久久久| 黄页网址在线观看| 日韩欧美亚洲在线| 亚洲国产一区二区三区在线| 久久九九国产视频| 99.玖玖.com| www.国产在线视频| 亚洲色图 在线视频| 怡红院亚洲色图| 久久资源av| 欧美亚洲精品日韩| 亚洲精品一卡二卡三卡四卡| 中文字幕色呦呦| 在线观看成年人视频| 人妖欧美1区| 亚洲妇女av| 国产精品国产一区| 蜜臂av日日欢夜夜爽一区| 国产精品理论片| 欧美疯狂做受xxxx富婆| 欧美精品一级二级| 最新中文字幕亚洲| 97色在线观看免费视频| 成人www视频在线观看| 成人综合电影| 日本免费成人网| 一本一道dvd在线观看免费视频| www.成人.com| 欧美激情护士| 深夜福利一区| 色88久久久久高潮综合影院| 激情丁香综合| 97久久精品人人澡人人爽| 久久久久国产精品厨房| 综合在线观看色| 精品久久久久久久人人人人传媒| 国产69精品久久久久9| 欧洲精品码一区二区三区免费看| 免费在线黄网| 欧美hdxxxxx| 一区二区三区视频播放| 亚洲美女视频| 第一会所亚洲原创| 成人同人动漫免费观看| 日韩高清电影一区| 国产欧美精品国产国产专区 | 电影91久久久| 欧美xnxx| 毛片网站在线观看| 日本无删减在线| 另类激情视频| 亚洲精品一级二级三级| 欧美成人一品| 精品一区二区影视| 国产亚洲欧美一级| 精品国产户外野外| 欧美一区二区精品在线| 在线播放日韩av| 97视频人免费观看| 91入口在线观看| 人妻互换免费中文字幕| 可以在线观看的av| 亚洲91在线| 丝袜美腿高跟呻吟高潮一区| 国产精品美女久久久久av爽李琼| 欧美日韩高清在线| 国产精品高潮在线| 9色porny| 番号集在线观看| 粉嫩av一区二区| 国内国产精品久久| 亚洲一本大道在线| 中文欧美在线视频| 日本道免费精品一区二区三区| 宅男在线国产精品| 欧美一区二区三区图| 国产成人在线小视频| 免费看的毛片| 91看片一区|