Apache Hive介绍

什么是Apache Hive

Apache Hive 是一个分布式、容错的数据仓库系统,
可实现大规模分析和 有助于使用 SQL 读取、写入和管理驻留
在分布式存储中的 PB 级数据。

什么是蜂巢

Apache Hive 是一个分布式容错数据仓库系统,可实现大规模分析。
 Hive Metastore(HMS)提供了一个中央元数据存储库,可以很容
 易地进行分析,以提供明智的信息。 数据驱动的决策,因此它是
 许多数据湖架构的关键组成部分。 Hive 建立在 Apache Hadoop 
 之上,支持通过 hdfs 在 S3、adls、gs 等上存储。 Hive 允许
 用户使用 SQL 读取、写入和管理 PB 级数据。

hiveserver2

HS2 支持多客户端并发和身份验证。 它旨在为 JDBC 和 ODBC 等开放
 API 客户端提供更好的支持。

Hive 元存储服务器 (HMS)

Hive 元存储 (HMS) 是关系数据库中 Hive 表和分区元数据的中央存储库,
 并使用元存储服务 API 为客户端(包括 Hive、Impala 和 Spark)提供对
 此信息的访问。 它已成为利用各种开源软件
 (如 Apache Spark 和 Presto)
 的数据湖的构建块。 事实上,一个完整的工具生态系统,
 无论是开源的还是其他的,都是围绕 Hive Metastore 构建的,
 这张图说明了其中的一些。

在这里插入图片描述

蜂巢酸

Hive 为 ORC 表提供完整的 ACID 支持,并且仅插入支持所有其他格式。

Hive 数据压缩

支持基于查询和基于 MR 的数据压缩。
## 蜂巢冰山
Hive 为 Apache Iceberg Tables 提供开箱即用的支持,
Apache Iceberg Tables 是一种云原生的 高性能开放表格式,
通过 Hive StorageHandler。

Hive 复制

Hive 支持用于备份和恢复的引导和增量复制

相关推荐

  1. SQLMap介绍

    2024-04-30 11:44:02       45 阅读
  2. GAN 介绍

    2024-04-30 11:44:02       64 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-30 11:44:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-30 11:44:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-04-30 11:44:02       87 阅读
  4. Python语言-面向对象

    2024-04-30 11:44:02       96 阅读

热门阅读

  1. 前端调用WebSocket协议接口获取数据

    2024-04-30 11:44:02       41 阅读
  2. 使用 Ant Design Vue踩过的那些坑

    2024-04-30 11:44:02       36 阅读
  3. 20240427-线程基础-结束线程

    2024-04-30 11:44:02       37 阅读
  4. C++:初始C++

    2024-04-30 11:44:02       27 阅读
  5. 初识MVC

    初识MVC

    2024-04-30 11:44:02      33 阅读
  6. QT 获取本机所有 IP 地址

    2024-04-30 11:44:02       37 阅读
  7. python深度拷贝

    2024-04-30 11:44:02       33 阅读
  8. Python实现qq邮箱天气提醒推送

    2024-04-30 11:44:02       31 阅读
  9. 数据库学习之常见的一些SQL命令

    2024-04-30 11:44:02       33 阅读