Hive分桶表

分桶表

一、准备数据

1,wsq1
2,wsq2
3,wsq3
4,wsq4
5,wsq5

二、开启分桶表的支持

set hive.enforce.bucketing=true;
set mapreduce.job.reduces=4;
set mapreduce.reduce.task=4;

三、创建分桶表

hive>create table bucketed_users(id int,name string) clustered by (id) sorted by (id) into 4 buckets row format delimited fields terminated by ',';

四、创建存放数据的表并将原数据加载入

hive> create table users(id int,name string) row format delimited fields terminated by ',';
hive> load data local inpath '/home/ec2-user/total/wsq' into table users;

五、数据装载到分桶表

hive> insert into bucketed_users select * from users;

相关推荐

  1. Hive

    2024-03-11 20:32:01       19 阅读
  2. Hive动态区和

    2024-03-11 20:32:01       38 阅读
  3. hive--索引(初篇)

    2024-03-11 20:32:01       14 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-03-11 20:32:01       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-11 20:32:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-11 20:32:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-11 20:32:01       18 阅读

热门阅读

  1. 机器学习是什么?如何从入门到精通?

    2024-03-11 20:32:01       19 阅读
  2. golang数组和Slice地址

    2024-03-11 20:32:01       21 阅读
  3. XR技术:短剧制作的全新纪元

    2024-03-11 20:32:01       24 阅读
  4. Docker从0到1的开始【入门篇】

    2024-03-11 20:32:01       23 阅读
  5. 聚乳酸-羟基乙酸共聚物行业调研报告

    2024-03-11 20:32:01       21 阅读
  6. Django-聚合查询

    2024-03-11 20:32:01       18 阅读