Hadoop

一、大数据分布式

1.1 数据导论

1. 什么是数据?

人类的行为及产生的事件的一种记录称之为数据

2. 数据有什么价值?

对数据的内容进行深入分析,可以更好的帮助了解事和物在现实世界的运行规律 比如,购物的订单记录(数据)可以帮助平台更好的了解消费者,从而促进交易。

1.2 大数据诞生

1. 大数据的诞生是跟随着互联网的发展的

当全球互联网逐步建成(2000年左右),各大企业或政府单位拥有了海量的数据亟待处理。 基于这个前提逐步诞生了以分布式的形式(即多台服务器集群)完成海量数据处理的处理方式,并逐步发展成现代大数据体系。

2. Apache Hadoop对大数据体系的意义

  1. 第一款获得业界普遍认可的开源分布式解决方案
  2. 让各类企业都有可用的企业级开源分布式解决方案
  3. 一定程度上催生出了众多的大数据体系技术栈
  4. 从Hadoop开始(2008年左右)大数据开始蓬勃发展

1.3 大数据概述

1. 什么是大数据

狭义上:对海量数据进行处理的软件技术体系

广义上:数字化、信息化时代的基础支撑,以数据为生活赋能

2. 大数据的5个主要特征

3. 大数据的核心工作:

  • 存储:妥善保存海量待处理数据

相关推荐

  1. Hadoop

    2023-12-24 07:06:09       31 阅读
  2. Hadoop

    2023-12-24 07:06:09       26 阅读
  3. <span style='color:red;'>Hadoop</span>

    Hadoop

    2023-12-24 07:06:09      38 阅读
  4. <span style='color:red;'>Hadoop</span>

    Hadoop

    2023-12-24 07:06:09      40 阅读
  5. <span style='color:red;'>hadoop</span>

    hadoop

    2023-12-24 07:06:09      9 阅读
  6. <span style='color:red;'>Hadoop</span>

    Hadoop

    2023-12-24 07:06:09      8 阅读
  7. Hadoop 概述

    2023-12-24 07:06:09       28 阅读
  8. Hadoop安装

    2023-12-24 07:06:09       27 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-24 07:06:09       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-24 07:06:09       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-24 07:06:09       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-24 07:06:09       18 阅读

热门阅读

  1. Python中使用YAML文件进行配置文件管理

    2023-12-24 07:06:09       42 阅读
  2. Semaphone应用&源码分析(二)

    2023-12-24 07:06:09       40 阅读
  3. 音视频转码

    2023-12-24 07:06:09       41 阅读
  4. obs video-scaler-ffmpeg.c 源码讲解

    2023-12-24 07:06:09       36 阅读
  5. 微信小程序生成一个天气查询的小程序

    2023-12-24 07:06:09       42 阅读
  6. C语言实现对数组去重算法详解

    2023-12-24 07:06:09       43 阅读