pyflink filter

import json
import re
import logging
import sys
from collections import Counter

from pyflink.datastream import DataStream, StreamExecutionEnvironment
from pyflink.datastream.functions import RuntimeContext, FlatMapFunction, MapFunction,FilterFunction
from pyflink.common.typeinfo import Types

s_env = StreamExecutionEnvironment.get_execution_environment()
data = DataStream(s_env._j_stream_execution_environment.socketTextStream('192.168.137.201', 8899))


# data.print()
def get_key():
    return '999'


class LogEvent:
    world = None

    def __init__(self, world):
        self.world = world
        # self.count = count

    def to_dict(self):
        return {
            "world": str(self.world)
            # "count": str(self.count)

        }


class MyMapFunction(FlatMapFunction):
    def open(self, runtime_context: RuntimeContext):
        pass

    def flat_map(self, raw_message):
        raw_message = raw_message.upper()
        dict1 = {}
        dict1['value'] = raw_message +'!!!'
        yield dict1

class myFilterFunction(FilterFunction):
    def filter(self,raw_message):
        if re.findall('AAA',raw_message):
             return raw_message

data.filter(myFilterFunction()).print()
s_env.execute('data')

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-05-04 02:38:01       19 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-05-04 02:38:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-05-04 02:38:01       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-05-04 02:38:01       20 阅读

热门阅读

  1. 【AI学习】人工智能 or 人造智能 or 人创智能

    2024-05-04 02:38:01       11 阅读
  2. 你用过最好用的AI工具有哪些?【模板】

    2024-05-04 02:38:01       10 阅读
  3. React 之 如何启动一个新的项目(六)

    2024-05-04 02:38:01       13 阅读
  4. python - mac安装mysqlclient

    2024-05-04 02:38:01       10 阅读
  5. 一步一步写线程之十一线程池应用内存池

    2024-05-04 02:38:01       12 阅读
  6. css实现瀑布流布局

    2024-05-04 02:38:01       11 阅读
  7. matlab绘制散点图

    2024-05-04 02:38:01       14 阅读
  8. L1-042 日期格式化

    2024-05-04 02:38:01       10 阅读