seatunnel数据集成(一)简介与安装

seatunnel数据集成(一)简介与安装
seatunnel数据集成(二)数据同步
seatunnel数据集成(三)多表同步
seatunnel数据集成(四)连接器使用
 


1、背景

About Seatunnel | Apache SeaTunnel

  • SeaTunnel 是一个简单易用的数据集成框架。
  • SeaTunnel的前身是 Waterdrop(中文名:水滴)自 2021 年 10 月 12日更名为 SeaTunnel。
  • 2021 年 12 月 9 日,SeaTunnel 正式通过 Apache 软件基金会的投票决议,以全票通过的优秀表现正式成为 Apache 孵化器项目。
  • 2022 年 3 月 18 日社区正式发布了首个 Apache 版本v2.1.0。

2、 应用场景

  • 海量数据的同步
  • 海量数据的集成
  • 海量数据的ETL
  • 海量数据聚合
  • 多源数据处理

3、 特点

  • 基于配置的低代码开发,易用性高,方便维护。
  • 支持实时流式传输
  • 离线多源数据分析
  • 高性能、海量数据处理能力
  • 模块化的插件架构,易于扩展
  • 支持用SQL进行数据操作和数据聚合
  • 支持Sparkstructured streaming
  • 支持Spark 2.x

4、优势

  • 丰富的连接器
  • 批流一体、多种开发模式
  • 转换海量数据
  • 易管理维护

5、安装部署

下载解压

https://dlcdn.apache.org/incubator/SeaTunnel/2.3.1/apache-SeaTunnel-incubating-2.3.1-bin.tar.gz

下载完毕之后上传到服务器上面并解压

# 解压

tar -zxvf apache-SeaTunnel-incubating-2.3.1-bin.tar.gz

下载对应的connector

在Apache的仓库下载相应的connector,下载时每个jar包在不同的路径下面,放到/SeaTunnel-2.3.1/connectors/SeaTunnel目录下

https://repo.maven.apache.org/maven2/org/apache/SeaTunnel/

配置安装SeaTunnel的插件

vim SeaTunnel-2.3.1/config/plugin_config

安装SeaTunnel

sh bin/install-plugin.sh 2.3.1

6、简单使用

bin目录下

install-plugin.sh                              --安装连接器脚本
 
seatunnel-cluster.sh                           -–集群模式启动脚本
 
seatunnel-cluster.sh                           --本地模式启动脚本
 
start-seatunnel-flink-13-connector-v2.sh       –-flink1.12-1.14版本引擎启动脚本
 
start-seatunnel-flink-15-connector-v2.sh       –-flink1.15-1.16版本引擎启动脚本
 
start-seatunnel-spark-2-connector-v2.sh        –-saprk2.x版本引擎启动脚本
 
start-seatunnel-spark-3-connector-v2.sh        –-saprk3.x版本引擎启动脚本
 
stop-seatunnel-cluster.sh                      -–集群模式关闭脚本
  • 默认引擎seatunnel.sh。
  • 提交spark任务用start-seatunnel-spark.sh。
  • 提交flink任务则用start-seatunnel-flink.sh。

可以指定3个参数

分别是:

--config 应用配置的路径

--variable 应用配置里的变量赋值

--check 检查config语法是否合法

相关推荐

  1. seatunnel数据集成(二)数据同步

    2024-02-06 05:46:05       37 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-02-06 05:46:05       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-02-06 05:46:05       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-02-06 05:46:05       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-02-06 05:46:05       18 阅读

热门阅读

  1. git的奇特知识点

    2024-02-06 05:46:05       29 阅读
  2. 各种编程语言送祝福:2024龙年大吉

    2024-02-06 05:46:05       31 阅读
  3. STM32_CAN调试模式解释:静默、回环、静默回环

    2024-02-06 05:46:05       36 阅读
  4. 使用Oracle数据库创建定时任务的方法

    2024-02-06 05:46:05       26 阅读
  5. 转换函数

    2024-02-06 05:46:05       31 阅读
  6. [Python进阶] 数据处理:Numpy入门

    2024-02-06 05:46:05       27 阅读
  7. 蓝桥杯刷题--python-1

    2024-02-06 05:46:05       39 阅读
  8. 初始化整形数组,后从小到大冒泡排序

    2024-02-06 05:46:05       34 阅读
  9. 基于单片机的LED显示系统

    2024-02-06 05:46:05       30 阅读
  10. 蓝桥杯刷题--python-2

    2024-02-06 05:46:05       28 阅读