七天爆肝flink笔记

一.flink整体介绍及wordcount案例代码

1.1整体介绍

从上到下包含有界无界流 支持状态 特点 与spark对比 应用场景 架构分层

 1.2示例代码

了解了后就整个demo吧

数据源准备 这里直接用的文本文件

gradle中的主要配置

group = 'com.example'
version = '0.0.1-SNAPSHOT'

java {
    sourceCompatibility = '11'
}

repositories {
    mavenCentral()
}

dependencies {
    implementation group: 'org.apache.flink', name: 'flink-streaming-java', version: '1.17.0'
    implementation group: 'org.apache.flink', name: 'flink-clients', version: '1.17.0'

}

 代码

package com.example.flinktest.test;

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

public class FlinkTurotial1_17 {

    public static void main(String[] args) throws Exception {

        //todo 1.创建执行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        //todo 2.读取数据
        DataStreamSource<String> stringDataStreamSource = env.readTextFile("D:\\juege\\code\\hope-backend\\opentech\\src\\main\\resources\\flinkTextSource.txt");

        //todo 3.进行数据处理 先 flatmap 再 keyby 再 sum 再打印输出
        stringDataStreamSource.flatMap(new FlatMapFunction<String, Tuple2<String, Integer>>() {
            @Override
            public void flatMap(String s, Collector<Tuple2<String, Integer>> collector) throws Exception {
                String[] words = s.split(" ");
                for (String word : words) {
                    if ("".equals(word)) {
                        continue;
                    }
                    collector.collect(new Tuple2<>(word, 1));
                }
            }
        }).keyBy(0).sum(1).print();

        //todo 4.执行任务
        env.execute("pantouyu");
    }

}

运行后控制台效果如下

二.flink部署(集群 standalone yarn) 

最近更新

  1. TCP协议是安全的吗?

    2024-02-16 06:06:03       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-02-16 06:06:03       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-02-16 06:06:03       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-02-16 06:06:03       20 阅读

热门阅读

  1. ROS-Ubuntu20.04环境安装

    2024-02-16 06:06:03       32 阅读
  2. [office] excel中排列序号的方法 #媒体#经验分享

    2024-02-16 06:06:03       26 阅读
  3. SpringMVC

    SpringMVC

    2024-02-16 06:06:03      19 阅读
  4. django-filter使用

    2024-02-16 06:06:03       28 阅读
  5. django admin页面美化

    2024-02-16 06:06:03       31 阅读
  6. linux系统下vscode portable版本的rust环境搭建003:rust

    2024-02-16 06:06:03       32 阅读
  7. 【AIGC】Stable Diffusion大模型分类

    2024-02-16 06:06:03       35 阅读
  8. 设备驱动开发_1

    2024-02-16 06:06:03       34 阅读
  9. 【FFmpeg学习】视频变慢处理

    2024-02-16 06:06:03       20 阅读
  10. vivado Latches、Tristates、

    2024-02-16 06:06:03       26 阅读
  11. 设计模式浅析

    2024-02-16 06:06:03       29 阅读
  12. 计算机视觉所需要的数学基础

    2024-02-16 06:06:03       30 阅读