国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

什么是數(shù)據(jù)同步利器DataX,如何使用?

開發(fā) 開發(fā)工具
DataX 是阿里云 DataWorks數(shù)據(jù)集成 的開源版本,使用Java 語言編寫,在阿里巴巴集團(tuán)內(nèi)被廣泛使用的離線數(shù)據(jù)同步工具/平臺(tái)。

今天給大家分享一個(gè)阿里開源的數(shù)據(jù)同步工具DataX,在Github擁有14.8k的star,非常受歡迎,地址:https://github.com/alibaba/DataX

什么是 Datax?

DataX 是阿里云 DataWorks數(shù)據(jù)集成 的開源版本,使用Java 語言編寫,在阿里巴巴集團(tuán)內(nèi)被廣泛使用的離線數(shù)據(jù)同步工具/平臺(tái)。DataX 實(shí)現(xiàn)了包括 MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、Hologres、DRDS, databend 等各種異構(gòu)數(shù)據(jù)源之間高效的數(shù)據(jù)同步功能。

圖片圖片

應(yīng)用場景有那些?

  1. 數(shù)據(jù)倉庫同步:DataX 可以幫助將數(shù)據(jù)從一個(gè)數(shù)據(jù)倉庫(如關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)存儲(chǔ)系統(tǒng)等)同步到另一個(gè)數(shù)據(jù)倉庫,實(shí)現(xiàn)數(shù)據(jù)的遷移、備份或復(fù)制。
  2. 數(shù)據(jù)庫遷移:當(dāng)我們需要將數(shù)據(jù)從一個(gè)數(shù)據(jù)庫平臺(tái)遷移到另一個(gè)數(shù)據(jù)庫平臺(tái)時(shí),DataX 可以幫助完成數(shù)據(jù)的轉(zhuǎn)移和轉(zhuǎn)換工作
  3. 數(shù)據(jù)集成與同步:DataX 可以用作數(shù)據(jù)集成工具,用于將多個(gè)數(shù)據(jù)源的數(shù)據(jù)進(jìn)行整合和同步。它支持多種數(shù)據(jù)源,包括關(guān)系型數(shù)據(jù)庫、NoSQL 數(shù)據(jù)庫、文件系統(tǒng)等,可以將這些數(shù)據(jù)源的數(shù)據(jù)整合到一個(gè)目標(biāo)數(shù)據(jù)源中。
  4. 數(shù)據(jù)清洗與轉(zhuǎn)換:DataX 提供了豐富的數(shù)據(jù)轉(zhuǎn)換能力,可以對數(shù)據(jù)進(jìn)行清洗、過濾、映射、格式轉(zhuǎn)換等操作。這對于數(shù)據(jù)倉庫、數(shù)據(jù)湖和數(shù)據(jù)集市等數(shù)據(jù)存儲(chǔ)和分析平臺(tái)非常有用,可以幫助提高數(shù)據(jù)質(zhì)量和一致性。
  5. 數(shù)據(jù)備份與恢復(fù):DataX 可以用于定期備份和恢復(fù)數(shù)據(jù)。通過配置定時(shí)任務(wù),可以將數(shù)據(jù)從源端備份到目標(biāo)端,并在需要時(shí)進(jìn)行數(shù)據(jù)恢復(fù)。

DataX支持那些數(shù)據(jù)源?

圖片圖片

架構(gòu)設(shè)計(jì)

圖片圖片

DataX作為離線數(shù)據(jù)同步框架,采用Framework + plugin架構(gòu)構(gòu)建。將數(shù)據(jù)源讀取和寫入抽象成為Reader/Writer插件,納入到整個(gè)同步框架中。

  • Reader:Reader為數(shù)據(jù)采集模塊,負(fù)責(zé)采集數(shù)據(jù)源的數(shù)據(jù),將數(shù)據(jù)發(fā)送給Framework。
  • Writer:Writer為數(shù)據(jù)寫入模塊,負(fù)責(zé)不斷向Framework取數(shù)據(jù),并將數(shù)據(jù)寫入到目的端。
  • Framework:Framework用于連接reader和writer,作為兩者的數(shù)據(jù)傳輸通道,并處理緩沖,流控,并發(fā),數(shù)據(jù)轉(zhuǎn)換等核心技術(shù)問題。

DataX 開源版本支持單機(jī)多線程模式完成同步作業(yè)運(yùn)行,如下圖

圖片圖片

  1. DataX完成單個(gè)數(shù)據(jù)同步的作業(yè),稱之為Job,DataX接受到一個(gè)Job之后,將啟動(dòng)一個(gè)進(jìn)程來完成整個(gè)作業(yè)同步過程。DataX Job模塊是單個(gè)作業(yè)的中樞管理節(jié)點(diǎn),承擔(dān)了數(shù)據(jù)清理、子任務(wù)切分(將單一作業(yè)計(jì)算轉(zhuǎn)化為多個(gè)子Task)、TaskGroup管理等功能。
  2. DataXJob啟動(dòng)后,會(huì)根據(jù)不同的源端切分策略,將Job切分成多個(gè)小的Task(子任務(wù)),以便于并發(fā)執(zhí)行。Task便是DataX作業(yè)的最小單元,每一個(gè)Task都會(huì)負(fù)責(zé)一部分?jǐn)?shù)據(jù)的同步工作。
  3. 切分多個(gè)Task之后,DataX Job會(huì)調(diào)用Scheduler模塊,根據(jù)配置的并發(fā)數(shù)據(jù)量,將拆分成的Task重新組合,組裝成TaskGroup(任務(wù)組)。每一個(gè)TaskGroup負(fù)責(zé)以一定的并發(fā)運(yùn)行完畢分配好的所有Task,默認(rèn)單個(gè)任務(wù)組的并發(fā)數(shù)量為5。
  4. 每一個(gè)Task都由TaskGroup負(fù)責(zé)啟動(dòng),Task啟動(dòng)后,會(huì)固定啟動(dòng)Reader—>Channel—>Writer的線程來完成任務(wù)同步工作。
  5. DataX作業(yè)運(yùn)行起來之后, Job監(jiān)控并等待多個(gè)TaskGroup模塊任務(wù)完成,等待所有TaskGroup任務(wù)完成后Job成功退出。否則,異常退出,進(jìn)程退出值非0

DataX調(diào)度流程

舉例來說,用戶提交了一個(gè)DataX作業(yè),并且配置了20個(gè)并發(fā),目的是將一個(gè)100張表的mysql數(shù)據(jù)同步到odps里面。DataX的調(diào)度決策是:

  1. Job根據(jù)分表切分成了100個(gè)Task。
  2. 根據(jù)20個(gè)并發(fā),DataX計(jì)算需要分配4個(gè)TaskGroup。
  3. 4個(gè)TaskGroup平分切分好的100個(gè)Task,每一個(gè)TaskGroup負(fù)責(zé)5個(gè)并發(fā)共計(jì)運(yùn)行25個(gè)Task。

如何使用 Datax?

點(diǎn)擊datax 下載,下載后解壓至本地某個(gè)目錄,如下圖

圖片圖片

用例說明

這里為了方便演示,我們同步MySQL的user_info表至MySQL的ods_test_mysql_user_info_m,同步條件為更新時(shí)間字段,如下

在實(shí)際工作中你可以選擇不同類型的數(shù)據(jù)源測試

drop table ods_test_mysql_user_info_m

CREATE TABLE `user_info` (
  `id` int NOT NULL COMMENT 'ID',
  `name` varchar(50) NOT NULL COMMENT '名稱',
  `sex` tinyint NOT NULL COMMENT '性別 1男 2女',
  `phone` varchar(11) COMMENT '手機(jī)',
 `address` varchar(1000)  COMMENT '地址',
 `age` int  COMMENT '年齡',
 `create_time` datetime(6) NOT NULL DEFAULT CURRENT_TIMESTAMP(6) COMMENT '創(chuàng)建時(shí)間',
  `update_time` datetime(6) NOT NULL DEFAULT CURRENT_TIMESTAMP(6) ON UPDATE CURRENT_TIMESTAMP(6) COMMENT '修改時(shí)間',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 COMMENT='用戶信息表';

CREATE TABLE `ods_test_mysql_user_info_m` (
  `id` int NOT NULL COMMENT 'ID',
  `name` varchar(50) NOT NULL COMMENT '名稱',
  `sex` tinyint NOT NULL COMMENT '性別 1男 2女',
  `phone` varchar(11) COMMENT '手機(jī)',
 `address` varchar(1000)  COMMENT '地址',
 `age` int  COMMENT '年齡',
 `create_time` datetime(6) NOT NULL DEFAULT CURRENT_TIMESTAMP(6) COMMENT '創(chuàng)建時(shí)間',
  `update_time` datetime(6) NOT NULL DEFAULT CURRENT_TIMESTAMP(6) ON UPDATE CURRENT_TIMESTAMP(6) COMMENT '修改時(shí)間',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb3 COMMENT='用戶信息數(shù)倉表';

在user_info表中插入數(shù)據(jù)如下

圖片圖片

創(chuàng)建作業(yè)的配置文件(json格式)

在 datax 的 script 目錄,創(chuàng)建ods_test_mysql_user_info_m.json文件,配置如下,mysqlreader表示讀取端,mysqlwriter表示寫入端

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "column": ["id","name","sex","phone","address","age","create_time","update_time"],
                       "splitPk": "id",
                        "connection": [
                            {
                                "jdbcUrl": ["jdbc:mysql://127.0.0.1:3306/test?useUnicode=true&characterEncoding=utf-8&useSSL=false"],
                                "table": ["user_info"]
                            }
                        ],
                        "password": "root",
                        "username": "root",
                        "where": "update_time > '${updateTime}' "
                    }
                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                       "writeMode": "replace",
                        "column": ["id","name","sex","phone","address","age","create_time","update_time"],
                        "connection": [
                            {
                                "jdbcUrl":"jdbc:mysql://127.0.0.1:3306/test?useUnicode=true&characterEncoding=utf-8&useSSL=false",
                                "table": ["ods_test_mysql_user_info_m"]
                            }
                        ],
                        "username": "root",
                        "password": "root",
                        "preSql": [],
                        "session": [
                          "set session sql_mode='ANSI'"
                        ]

                    }
                }
            }
        ],
        "setting": {
            "speed": {
                "channel": "5"
            }
        }
    }
}

創(chuàng)建執(zhí)行腳本

為了更貼合實(shí)際,寫一個(gè)調(diào)度腳本sync.sh支持動(dòng)態(tài)參數(shù)來執(zhí)行任務(wù)

#!/bin/bash
## 執(zhí)行示例 sh /Users/weizhao.dong/Documents/soft/datax/datax-script/call.sh /Users/weizhao.dong/Documents/soft/datax/datax-script/dwd_g2park_inout_report_s.json 1
jsnotallow=$1
echo '執(zhí)行腳本:'$jsonScript
interval=$2
echo "時(shí)間間隔(分鐘):"$interval
now_time=$(date '+%Y-%m-%d %H:%M:%S')
echo "當(dāng)前時(shí)間:"$now_time
update_time=$(date -v -${interval}M  '+%Y-%m-%d %H:%M:%S')
#linux 更新時(shí)間獲取
#update_time=$(date -d "${now_time} $interval minute ago" +"%Y-%m-%d %H:%M:%S")
echo "更新時(shí)間:"$update_time
#執(zhí)行
python3 /Users/weizhao.dong/Documents/soft/datax/bin/datax.py $jsonScript -p "-DupdateTime='${update_time}'"

假設(shè)我們要執(zhí)以上ods_test_mysql_user_info_m.json腳本,并且同步十分鐘之前的數(shù)據(jù),如下

./sync.sh ods_test_mysql_user_info_m.json 10

測試

圖片圖片

執(zhí)行./sync.sh ods_test_mysql_user_info_m.json 10進(jìn)行同步

圖片圖片

圖片

圖片圖片

以上結(jié)果可能有些人有疑問,就三條數(shù)據(jù)執(zhí)行時(shí)間為 10s,其實(shí)這個(gè) 10s主要是初始化時(shí)間,耗時(shí)過長,同步的數(shù)據(jù)量多了優(yōu)勢就體現(xiàn)出來了,以下為實(shí)際生產(chǎn)同步數(shù)據(jù)結(jié)果,可以看到同步63102條耗時(shí)22s

推薦用法

以上我們只是通過一個(gè)簡單的示例來演示了dataX如何使用,如果只是一次性同步,沒問題,但是如果是周期性進(jìn)行同步,有以下幾種方式推薦

crontab調(diào)度

這種方式是最簡單的,可以使用操作系統(tǒng)中的crontab定時(shí)調(diào)度,通過crontab -e編輯corn 任務(wù),添加對應(yīng)腳本即可

海豚調(diào)度器

在種方式在大數(shù)據(jù)領(lǐng)域用的比較多,典型場景就是 mysql 同步到數(shù)倉,海豚調(diào)度器內(nèi)置了 datax 并且提供了圖形化配置界面,配置起來非常方便

圖片圖片

圖片圖片

同時(shí)每次執(zhí)行都有記錄,并且都有對應(yīng)的日志

圖片圖片

定時(shí)任務(wù)框架(elasticjob/xxl-job)

定時(shí)調(diào)度框架都支持調(diào)度 shell 腳本,通過傳入對應(yīng)參數(shù)也可執(zhí)行

圖片 圖片

責(zé)任編輯:武曉燕 來源: 架構(gòu)成長指南
相關(guān)推薦

2016-08-21 14:19:05

數(shù)據(jù)工具DataXSqoop

2024-09-14 10:39:21

瀏覽器區(qū)域導(dǎo)航

2025-08-11 01:15:00

2020-09-21 06:53:41

NoSQL高并發(fā)面試

2024-02-29 08:02:27

KubernetesDaemonSet集群

2024-04-10 10:11:14

藍(lán)牙藍(lán)牙網(wǎng)關(guān)

2023-09-07 08:15:58

場景同步異步

2023-03-17 18:58:36

日志查詢同步

2023-06-05 08:00:00

mTLSIstio安全

2016-08-18 01:45:05

數(shù)據(jù)科學(xué)數(shù)據(jù)產(chǎn)品

2020-11-17 14:28:56

數(shù)據(jù)中心

2022-04-26 16:56:20

行為數(shù)據(jù)數(shù)據(jù)

2023-11-09 12:59:00

微力同步數(shù)據(jù)傳輸工具

2022-02-27 15:28:53

大數(shù)據(jù)挑戰(zhàn)戰(zhàn)略

2020-04-14 14:50:13

ArchLinuxAUR

2023-09-15 16:14:14

2021-02-18 09:23:47

數(shù)據(jù)庫分區(qū)數(shù)據(jù)庫倉庫

2025-10-15 02:11:00

2017-12-19 21:29:58

物聯(lián)網(wǎng)區(qū)塊鏈大數(shù)據(jù)

2013-03-06 16:06:31

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

99久久久久| 美女免费视频一区| 欧美性视频精品| 亚洲精品观看| 97精品国产97久久久久久免费| 国产精品亚洲片在线播放| 7m精品福利视频导航| 成人在线免费观看网站| 精品国产乱码久久久久久久软件 | 国产乱一区二区| 精品国产乱码久久久久久久久| 黄色aa久久| 午夜精品久久久久久久99热浪潮| 欧美激情 亚洲a∨综合| 欧美日韩国产免费一区二区三区| 丁香天五香天堂综合| 国产日韩欧美精品在线观看| 国产精品免费视频一区| 91伦理视频在线观看| 精品一区二区三区电影| 高潮久久久久久久久久久久久久| 久久久精品综合| 少妇激情av一区二区三区| 亚洲视频网在线直播| 四虎影视在线观看2413| 亚洲黄色www网站| 久草在线综合| 潘金莲一级淫片aaaaa免费看| 久久久www免费人成精品| 黄色av成人| 日韩精品一区二区三区外面| 国产二区国产一区在线观看| 99热在线观看| 欧美日韩一级视频| 久久三级中文| 婷婷四月色综合| 中文成人av在线| 国产91一区二区三区| 国产欧美精品一区aⅴ影院| 午夜视频在线观看网站| 久久精品国产亚洲7777| 三级欧美韩日大片在线看| 女人高潮特级毛片| 日韩在线观看你懂的| 欧美va天堂| www浪潮av99com| 一区二区三区国产视频| 日韩av一二三| 182tv在线播放| 成人18视频| 邻家有女韩剧在线观看国语| 久久综合电影一区| 精品一区二区在线看| www亚洲人| 91久久在线播放| 亚洲另类一区二区| 美女精品久久| 国产淫片av片久久久久久| 久久久91精品国产| 国产精品欧美极品| 99ri日韩精品视频| 一级毛片视频| 国产一区二区高清不卡| 欧美精品一区二区三区很污很色的 | 欧美丝袜丝交足nylons172| 欧美黄色性生活| 成人h猎奇视频网站| 欧美成人a∨高清免费观看| 奇米四色…亚洲| 日韩免费小视频| 永久www成人看片| 2022国产精品| 欧美成人免费网站| 久久久久久久久伊人| 丝袜av一区| a毛片在线播放| 欧美日韩怡红院| 91香蕉国产在线观看| 日韩高清影视在线观看| 国产二区视频在线观看| 日韩视频在线免费播放| 国产91在线播放九色快色| 日韩精品在线看片z| 国产精品国产馆在线真实露脸| 天天综合亚洲| 开心激情综合| 国内小视频在线看| 羞羞视频在线免费看| 亚洲五月六月| 国产精品久久久久久亚洲影视| 亚洲第一页在线| 国产精品久久久久久久久免费丝袜| 在线观看日韩av电影| av亚洲一区| 亚洲最大的网站| 91av在线免费观看| 日韩精品免费综合视频在线播放| 亚洲欧洲国产日本综合| 国产成人自拍网| 免费xxxx性欧美18vr| 久久夜色电影| 1234区中文字幕在线观看| 极品粉嫩饱满一线天在线| 五十路熟女丰满大屁股| 欧美日韩免费高清| 91免费在线视频| 97色在线视频| 色多多国产成人永久免费网站 | 免费播放片a高清在线观看| 欧美极品少妇无套实战| 国产区一区二区三区| 国产精品免费在线免费| 97在线视频免费看| 亚洲色图国产精品| 日韩精品在线私人| 欧洲人成人精品| 亚洲国产精品久久人人爱蜜臀 | 91免费日韩| 一本色道久久亚洲综合精品蜜桃 | 91网站视频在线观看| 国产精品羞羞答答xxdd| 麻豆91小视频| 国产精品一区二区三区网站| 日韩电影在线一区| 丁香亚洲综合激情啪啪综合| 成人在线视频一区| www.成人网.com| 亚洲视频每日更新| 制服丝袜日韩国产| 精品国产一区二区亚洲人成毛片| 精品国产电影一区二区| 九九热精品在线| 91高清视频在线免费观看| 成人欧美一区二区三区在线湿哒哒| 翡翠波斯猫1977年美国| 欧美日韩国产精品一卡| 免费成人在线视频网站| julia中文字幕久久亚洲蜜臀| a在线免费观看| 四虎精品在线观看| 婷婷丁香综合| 韩国v欧美v日本v亚洲v| 中文字幕亚洲一区二区av在线| 国产精品.com| 东北一级毛片| 香蕉97视频观看在线观看| 成人在线app| 免费看久久久| 免费成人小视频| 一区二区三区中文在线观看| 日韩女同互慰一区二区| 国产精品久久久久久久久图文区| 欧美性猛交99久久久久99按摩| 亚洲美女在线视频| 国产精品免费一区豆花| 色姑娘综合网| 2020中文字幕在线播放| 少妇精品视频一区二区免费看| 国产精品 日产精品 欧美精品| 亚洲一区国产精品| 国产一区二区在线免费| 天天操天天爽天天射| 欧美日一区二区三区| 国产黑丝在线一区二区三区| 亚洲国产精品久久| 在线不卡视频一区二区| 天堂中文av在线资源库| 国产精品一区在线观看乱码| 亚洲午夜女主播在线直播| 欧美日韩亚州综合| 久久久久久噜噜噜久久久精品| 精品一卡二卡三卡| 亚洲欧美一区二区三区| 9.1麻豆精品| 亚洲第一毛片| 蜜桃av综合| 欧美精品自拍偷拍动漫精品| 欧洲高清一区二区| 日韩网站中文字幕| 国产欧美一区二区精品忘忧草| 55夜色66夜色国产精品视频| 中文字幕乱在线伦视频乱在线伦视频 | 欧美丝袜足交| 精品少妇av| 日韩精品一卡| 日韩和欧美的一区| 亚洲综合成人在线| 精品99一区二区三区| 欧美大片国产精品| 国产一区二区三区在线观看网站| 91成人免费观看网站| 久久久久久久久一区二区| 四虎黄色影院| 日韩一级特黄| 国产精品1区二区.| 一本高清dvd不卡在线观看| 日韩在线观看精品| 91网站在线看| 自由色视频.| 亚洲福利合集|