从零开始学大数据框架Hudi,这些学习网站,助你一臂之力!

介绍:Apache Hudi是一个开源的流数据湖平台,由Uber开发并现在已经成为Apache的顶级项目。Hudi的设计使得您可以在Hadoop兼容的存储之上存储大量数据,并且它提供了两种原语,除了经典的批处理之外,还可以在数据湖上进行流处理。
Hudi将核心仓库和数据库功能直接带到数据湖中,包括表、事务、高效的upserts/删除、高级索引、流式摄取服务、数据群集/压缩优化以及并发,同时保持数据以开源文件格式保留。具体来说,Hudi的一个重要特性是Timeline,可以理解为Hudi表的一个时间线,记录了Hudi表在不同时刻的信息和行为。这个Timeline由TimelineServer来管理,通常存在于Hdfs、RDBMS等持久化存储介质中。通过Timeline可以方便地做版本管理以及实现增量处理等和版本/时间相关的功能。

1、hudi官网

网址:https://hudi.apache.org/

1.1 介绍

在这里插入图片描述
在这里插入图片描述

1.2 学习文档

在这里插入图片描述

1.3 用户群体

在这里插入图片描述

2、https://dongkelun.com/tags/Hudi/

网址:https://dongkelun.com/tags/Hudi/

2.1 知识点介绍

在这里插入图片描述
在这里插入图片描述

3、视频学习推荐

1、大数据新风口:Hudi数据湖(尚硅谷&Apache Hudi联合出品)
网址:https://www.bilibili.com/video/BV1ue4y1i7na/?vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
在这里插入图片描述
2、黑马程序员大数据数据湖架构Hudi视频教程,从Apache Hudi基础到项目实战(涵盖HDFS+Spark+Flink+Hive等知识点
网址:https://www.bilibili.com/video/BV1sb4y1n7hK/?spm_id_from=333.337.search-card.all.click&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b

在这里插入图片描述

4、hudiz中文网站

网址:https://hudi.apache.org/cn/docs/next/overview/
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
以上就是个人觉得不错的学习网站,希望能帮到学习大数据的人!

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-26 21:04:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-26 21:04:01       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-26 21:04:01       82 阅读
  4. Python语言-面向对象

    2023-12-26 21:04:01       91 阅读

热门阅读

  1. 【Unity】对象池技术

    2023-12-26 21:04:01       60 阅读
  2. arm32 arm64 读取PMCCNTR cpu cycle counter

    2023-12-26 21:04:01       94 阅读
  3. 【Git使用小技巧】一个项目使用多个远程仓库

    2023-12-26 21:04:01       66 阅读
  4. .NET 7(C#)配置使用log4net日志框架的方法

    2023-12-26 21:04:01       47 阅读
  5. 前端面试题html

    2023-12-26 21:04:01       57 阅读
  6. Day01-BootStrap

    2023-12-26 21:04:01       48 阅读
  7. 【漏洞库】其他漏洞5

    2023-12-26 21:04:01       50 阅读
  8. StringBuilder和Stringjoiner

    2023-12-26 21:04:01       50 阅读