大数据的技术栈-逐步完善

目录

1.hadoop

        a.HDFS分布式文件系统

        b.Yarn集群资源管理器

        c.MapReduce sql引擎

        d.Impala sql引擎

        e.工具概观

2.数据仓库知识

        a.Hive数据库

                1)Hive Sql

                2)数据库结构

        b.Doris数据库

3.混合处理框架SPARK

        a.Spark

        b.集群架构

4.数仓模型知识

5.开发工具

        a.Dbeaver

        b.Idea

6.kafka


转职开始做大数据了,逐步跟着学习的脚本把知识变成自己的

1.hadoop

        a.HDFS分布式文件系统

        b.Yarn集群资源管理器

                前端工作流异常时候 yarn检查异常信息-CSDN博客

                

        c.MapReduce sql引擎

        d.Impala sql引擎

        e.工具概观

2.数据仓库知识

        a.Hive数据库

                1)Hive Sql

                2)数据库结构

        b.Doris数据库

3.混合处理框架SPARK

        a.Spark

                1)SCALA

                        Scala中的选项(Options )-CSDN博客

        b.集群架构

                使用spark进行递归的可行方案-CSDN博客

                spark读取和保存本机文件-CSDN博客

                本机spark 通idea连接Oracle的坑-CSDN博客

4.数仓模型知识

        a.分层逻辑

        b.模型规范

        c.指标检查

5.开发工具

        

        a.Dbeaver

        b.Idea

                windows idea本地执行spark sql避坑-CSDN博客

6.kafka

相关推荐

  1. 数据技术-逐步完善

    2023-12-05 16:28:04       44 阅读
  2. tsv文件在数据技术应用场景

    2023-12-05 16:28:04       24 阅读
  3. 数据技术2023:Apache Hadoop和Spark实战

    2023-12-05 16:28:04       9 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-05 16:28:04       14 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-05 16:28:04       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-05 16:28:04       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-05 16:28:04       18 阅读

热门阅读

  1. Qt Location中加载地图对象

    2023-12-05 16:28:04       34 阅读
  2. mysql面试相关问题及答案

    2023-12-05 16:28:04       32 阅读
  3. JVM 常识

    2023-12-05 16:28:04       40 阅读
  4. GORM gorm.DB 对象剖析

    2023-12-05 16:28:04       29 阅读
  5. 基于c 实现 FIFO

    2023-12-05 16:28:04       32 阅读
  6. 服务器固件

    2023-12-05 16:28:04       32 阅读
  7. 深入浅出 Golang 中的直接依赖和间接依赖管理

    2023-12-05 16:28:04       28 阅读