海豚调度系列之:任务类型——Apache SeaTunnel

一、Apache SeaTunnel

SeaTunnel 任务类型,用于创建并执行 SeaTunnel 类型任务。worker 执行该任务的时候,会通过 start-seatunnel-spark.sh 、 start-seatunnel-flink.sh 和 seatunnel.sh 命令解析 config 文件。

二、创建任务

  • 点击项目管理 -> 项目名称 -> 工作流定义,点击“创建工作流”按钮,进入 DAG 编辑页面;
  • 拖动工具栏的 任务节点到画板中。

三、任务参数

  • 启动脚本:选择你想要运行任务的启动脚本,包括 seatunnel.sh, start-seatunnel-flink-13-connector-v2.sh, start-seatunnel-flink-15-connector-v2.sh, start-seatunnel-flink-connector-v2.sh, start-seatunnel-flink.sh, start-seatunnel-spark-2-connector-v2.sh, start-seatunnel-spark-3-connector-v2.sh, start-seatunnel-spark-connector-v2.sh, start-seatunnel-spark.sh
  • FLINK
  • 运行模型:支持 run 和 run-application 两种模式
  • 选项参数:用于添加 Flink 引擎本身参数,例如 -m yarn-cluster -ynm seatunnel
  • SPARK
  • 部署方式:指定部署模式,cluster client
  • Master:指定 Master 模型,yarn local spark mesos,其中 spark 和 mesos 需要指定 Master 服务地址,例如:127.0.0.1:7077
  • SEATUNNEL_ENGINE
  • 部署方式:指定部署模式,cluster local
  • 自定义配置:支持自定义配置或从资源中心选择配置文件
  • 脚本:在任务节点那自定义配置信息,包括四部分:env source transform sink

四、任务样例

该样例演示为使用 Flink 引擎从 Fake 源读取数据打印到控制台。

1.在 DolphinScheduler 中配置 SeaTunnel 环境

若生产环境中要是使用到 SeaTunnel 任务类型,则需要先配置好所需的环境,配置文件如下:/dolphinscheduler/conf/env/dolphinscheduler_env.sh。

在这里插入图片描述

2.配置 SeaTunnel 任务节点

根据上述参数说明,配置所需的内容即可。

在这里插入图片描述

Config 样例

env {
  execution.parallelism = 1
}

source {
  FakeSource {
    result_table_name = "fake"
    field_name = "name,age"
  }
}

transform {
  sql {
    sql = "select name,age from fake"
  }
}

sink {
  ConsoleSink {}
}

相关推荐

  1. 海豚调度系列:集群部署(Cluster)

    2024-03-14 22:58:03       38 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-14 22:58:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-14 22:58:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-14 22:58:03       82 阅读
  4. Python语言-面向对象

    2024-03-14 22:58:03       91 阅读

热门阅读

  1. SpringBoot RestTemplate远程调用总结

    2024-03-14 22:58:03       41 阅读
  2. Tomcat

    Tomcat

    2024-03-14 22:58:03      37 阅读
  3. 【matlab】如何将.mat文件与.nii文件互转

    2024-03-14 22:58:03       46 阅读
  4. CopyOnWriteArrayList是线程安全的吗?

    2024-03-14 22:58:03       43 阅读
  5. C语言如何定义⼆维数组?

    2024-03-14 22:58:03       40 阅读
  6. c# 多线程创建及线程同步

    2024-03-14 22:58:03       37 阅读
  7. Python学习DAY14_文档处理_Excel

    2024-03-14 22:58:03       36 阅读
  8. Unity3D 基于ECS的AI思考与怪物同步详解

    2024-03-14 22:58:03       42 阅读
  9. Memcached

    Memcached

    2024-03-14 22:58:03      33 阅读
  10. PCL点云裁剪CropBox

    2024-03-14 22:58:03       37 阅读