查看Hive表信息及占用空间的方法

一、Hive下查看数据表信息的方法

方法1:查看表的字段信息
desc table_name;

方法2:查看表的字段信息及元数据存储路径
desc extended table_name;

方法3:查看表的字段信息及元数据存储路径
desc formatted table_name;

方法4:查看建表语句及其他详细信息的方法
show create table table_name;

备注:查看表元数据存储路径时,推荐方法3,信息比较清晰。

二、查看表容量大小

方法1:查看一个hive表文件总大小时(单位为Byte),可以通过一行脚本快速实现,其命令如下:

查看普通表的容量

[pgxl@master ~]$ hadoop fs -ls /home/pgxl/opt/hive-1.2.1/hive-warehouse/tmp.db/wuxn_test_df|awk -F ' ' '{print $5}'|awk '{a+=$1}END{print a}'
[pgxl@master ~]$ hadoop fs -ls /home/pgxl/opt/hive-1.2.1/hive-warehouse/tmp.db/wuxn_test_df|awk -F ' ' '{print $5}'|awk '{a+=$1}END{print a/(1024*1024*1024)}'

这样可以省去自己相加,下面命令是列出该表的详细文件列表

[pgxl@master ~]$ hadoop fs -ls /home/pgxl/opt/hive-1.2.1/hive-warehouse/tmp.db/wuxn_test_df

统计文件详细数目

[pgxl@master ~]$ hadoop fs -ls /home/pgxl/opt/hive-1.2.1/hive-warehouse/tmp.db/wuxn_test_df|wc -l

查看分区表的容量

[pgxl@master ~]$ hadoop fs -ls /home/pgxl/opt/hive-1.2.1/hive-warehouse/tmp.db/wuxn_test_df/yyyymm=202301|awk -F ' ' '{print $5}'|awk '{a+=$1}END {print a/(1024*1024*1024)}'

这样可以省去自己相加,下面命令是列出该表的详细文件列表

[pgxl@master ~]$ hadoop fs -ls /home/pgxl/opt/hive-1.2.1/hive-warehouse/tmp.db/wuxn_test_df/yyyymm=202301

方法2:查看该表总容量大小,单位为G

[pgxl@master ~]$ hadoop fs -du /home/pgxl/opt/hive-1.2.1/hive-warehouse/tmp.db/wuxn_test_df|awk ' { SUM += $1 } END { print SUM/(1024*1024*1024) }'

查看hive库的大小

 hadoop fs -count -q -h /data/hive/warehouse/wedw_dw.db

相关推荐

  1. 查看Hive信息占用空间方法

    2023-12-07 18:54:03       61 阅读
  2. hive占用空间大小命令

    2023-12-07 18:54:03       46 阅读
  3. MySQL 查询库 和 占用空间大小 语句

    2023-12-07 18:54:03       31 阅读
  4. 查看Hive描述信息,包括在HDFS上Location信息

    2023-12-07 18:54:03       27 阅读
  5. 查询MongoDB中某个数据库占用空间大小

    2023-12-07 18:54:03       33 阅读
  6. postgresql查看数据库占用空间大小

    2023-12-07 18:54:03       42 阅读
  7. Linux 如何查看磁盘空间占用

    2023-12-07 18:54:03       32 阅读
  8. Windows与Linux端口占用查看、杀死方法

    2023-12-07 18:54:03       33 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-07 18:54:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-07 18:54:03       106 阅读
  3. 在Django里面运行非项目文件

    2023-12-07 18:54:03       87 阅读
  4. Python语言-面向对象

    2023-12-07 18:54:03       96 阅读

热门阅读

  1. 虎牙C++技术面经

    2023-12-07 18:54:03       45 阅读
  2. Python-字典详解

    2023-12-07 18:54:03       57 阅读
  3. gitlab-ci.yml 同步https 仓库地址

    2023-12-07 18:54:03       54 阅读
  4. Dockerfile构建Python-Ubuntu-Opencv环境

    2023-12-07 18:54:03       56 阅读
  5. git概念及使用方式

    2023-12-07 18:54:03       43 阅读
  6. ES6与ES5的区别?

    2023-12-07 18:54:03       52 阅读