Flink电商实时数仓项目部署上线

Flink实时数仓部署

  1. 将common作为一个自定义的依赖部署到maven中
  2. 使用maven将各个子模块打包
  3. 可以使用FLink框架进行jar包的提交运行。

StreamPark

一个易于使用的流处理应用开发框架和一站式流处理操作平台和管理流应用。它提供了Flink和Spark编写流的脚手架。

  1. Core:可以使用FlinkSQL来编写简单的业务逻辑
  2. pump:提供各种连接器
  3. console:控制台,集成了项目编译、发布、参数配置、启动、保存点、火焰图、监控等功能(重点)

安装StreamPark

  1. 安装Linux的maven, 可以去检查一下版本目前是否还存在。
  2. 解压到/opt/moduel目录下
  3. 创建软链接,连接bin/mvn 和/usr/bin/mvn这两个目录
  4. 修改镜像源为国内的阿里镜像
  5. 上传streamPark的jar包
  6. 将mysql目录下的conncector连接器jar包复制到到streamPark的lib目录下
  7. 运行建库和建表的脚本在这里插入图片描述
  8. 修改配置文件application.yml
    • profiles.actives: mysql 改为mysql
    • 工作目录
      • local:/opt/module/stream_park_workspace
      • remote: HDFS路径
    • 配置mysql.yml

项目部署

  1. 打开Gitee或gitLab,复制仓库地址
  2. 复制到仓库地址到StreamPark中,点击构建项目,此时会下载各种依赖jar包,需要等待一会
  3. 上传common模块的jar包到HDFS中
  4. 添加作业,使用自定义代码,配置一些常用的参数
  5. 启动hadoop, yarn, zookeeper,redis等框架
  6. 发布作业

数据接口可视化

dws层已经把轻度聚合的结果保存到了Doris中,后续只要从Doris读取数据再做简单聚合即可。数据可视化主要看面向两种客户:

  • 数据开发人员
  • 普通客户

在这里插入图片描述

Suglar可视化

  1. 登录百度云,即可免费试用一个月
  2. 创建空白大屏
  3. 在数据->静态Json可以查看一下数据展示所需的格式
  4. 创建gmall-publisher项目,Spring boot架构
  5. 确定对外的服务端口号为8070,读取Doris数据的端口号为9030

相关推荐

  1. Flink实时(四)

    2024-01-10 05:52:01       65 阅读
  2. 从 Spark 离线Flink 实时实战指南

    2024-01-10 05:52:01       24 阅读
  3. Flink实时商数(九)

    2024-01-10 05:52:01       52 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-10 05:52:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-10 05:52:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-10 05:52:01       82 阅读
  4. Python语言-面向对象

    2024-01-10 05:52:01       91 阅读

热门阅读

  1. R语言学习入门(一)

    2024-01-10 05:52:01       47 阅读
  2. 实验8 分析HTTP协议和DNS

    2024-01-10 05:52:01       56 阅读
  3. 【Python】Excel不同sheet另存为不同CSV

    2024-01-10 05:52:01       54 阅读
  4. Golang switch 语句

    2024-01-10 05:52:01       62 阅读
  5. 线程与进程学习笔记

    2024-01-10 05:52:01       40 阅读
  6. Spring MVC参数的接收方式!!!

    2024-01-10 05:52:01       52 阅读
  7. 师傅带练|大数据人工智能在线实习项目特色

    2024-01-10 05:52:01       58 阅读
  8. c++ std::move()到底干了什么

    2024-01-10 05:52:01       54 阅读
  9. C# 前端GET或POST传递的两种参数body和query的区别

    2024-01-10 05:52:01       63 阅读
  10. numpy库的一些常用函数

    2024-01-10 05:52:01       49 阅读
  11. 数据治理工程师 CDGA-数据治理

    2024-01-10 05:52:01       50 阅读
  12. 【Spring】容器

    2024-01-10 05:52:01       59 阅读