【基础知识】大数据概述

关键词—分布式

化整为零,再化零为整

大数据的定义

传统数据库处理起来困难的数据集。

发展历程

请添加图片描述

中国开源生态图谱2023

image.png

参考内容

中国开源生态图谱 2023.pdf

技术组件说明

数据集成

sqoop、dataX、flume

数据存储

hdfs、kafka

数据处理

mapreduce、hive、impala、spark、flink

数据分析

hbase、mysql、greenplum(postgreSQL)、clickhouse

应用场景

数据分析——决策
大数据是一种解决方案,但不一定是最高效的方案。

相关推荐

  1. 数据知识分享:数据产业必知概念

    2023-12-12 14:02:02       63 阅读
  2. 数据(十一):概率统计基础

    2023-12-12 14:02:02       60 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-12 14:02:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-12 14:02:02       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-12 14:02:02       82 阅读
  4. Python语言-面向对象

    2023-12-12 14:02:02       91 阅读

热门阅读

  1. Docker入门概念

    2023-12-12 14:02:02       61 阅读
  2. 简单的小题集(八)

    2023-12-12 14:02:02       59 阅读
  3. openssl的x509命令工具

    2023-12-12 14:02:02       60 阅读
  4. C++入门【6-C++ 修饰符类型】

    2023-12-12 14:02:02       46 阅读
  5. DevOps|研发提效-敏捷开发之任务看板

    2023-12-12 14:02:02       56 阅读
  6. 《C++新经典设计模式》之第10章 迭代器模式

    2023-12-12 14:02:02       56 阅读
  7. 《C++新经典设计模式》之第11章 组合模式

    2023-12-12 14:02:02       37 阅读