大数据主要技术

1.大数据文件系统:

GFS(谷歌的分布式文件系统) 

HDFS(hadoop distrubuted file system)分布式文件系统,衍生自GFS

2.大数据平台

MapReduce :谷歌的大数据处理平台,服务于搜索

Hadoop:批量和静态数据,运用最广泛

Spark:Berkeley的交互式数据处理系统,特点是快

3.大数据的数据库

Big Table:分布式数据库,主要储存结构化数据

Dynamo:亚马逊的,改进了哈希表和向量时钟vector clock

==============================主要技术============================

分布式存储:

GFS/HDFS

BIG TABLE/HBASE

NOSQL

NEWSQL

分布式处理:

MAP REDUCE

计算机方面:

同构/异构的计算机集群,被集群的可以看做一台计算机,如linux的虚拟服务器

大数据的处理流程

相关推荐

  1. 数据数据上云的主要优点

    2024-03-20 20:58:02       26 阅读
  2. 数据技术发展

    2024-03-20 20:58:02       33 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-03-20 20:58:02       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-20 20:58:02       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-20 20:58:02       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-20 20:58:02       18 阅读

热门阅读

  1. 绘制虚线圆角矩形的Flutter小部件

    2024-03-20 20:58:02       18 阅读
  2. 一个好用的前端工具包 - 百涂工具

    2024-03-20 20:58:02       18 阅读
  3. git教程编写初衷

    2024-03-20 20:58:02       19 阅读
  4. Leetcode 239 滑动窗口最大值

    2024-03-20 20:58:02       20 阅读
  5. 动态加载CSS文件

    2024-03-20 20:58:02       17 阅读
  6. 如何从零开始拆解uni-app开发的vue项目(二)

    2024-03-20 20:58:02       17 阅读
  7. Python 中可以用来生成 SVG 图的库

    2024-03-20 20:58:02       21 阅读
  8. linux系统中的PS命令详解

    2024-03-20 20:58:02       19 阅读