Hive命令调优大全

explain语法查询**

– explain解析执行计划

以下优化为hive层面优化,常开****

– 读取零拷贝
set hive.exec.orc.zerocopy=true; – 默认false
– 关联优化器
set hive.optimize.correlation=true; – 默认false
– fetch本地抓取
set hive.fetch.task.conversion=minimal; – 新版本默认more,老版本默认minimal
– 针对小文件开启本地模式
set hive.exec.mode.local.auto=true; – 默认false
– 并行执行任务
set hive.exec.parallel=true; – 打开任务并行执行,默认false
set hive.exec.parallel.thread.number=16; – 同一个sql允许最大并行度,默认为8
– Map端聚合相关配置
set hive.map.aggr = true; – 开启Map端聚合,默认是true
set hive.groupby.mapaggr.checkinterval = 100000; – 设置在Map端进行聚合操作的条目数目,默认100000

相关推荐

  1. Hive命令大全

    2024-01-12 12:18:02       36 阅读
  2. Hive总结

    2024-01-12 12:18:02       20 阅读
  3. HIVE

    2024-01-12 12:18:02       11 阅读
  4. Hive一文打尽

    2024-01-12 12:18:02       30 阅读
  5. Linux相关命令汇总

    2024-01-12 12:18:02       33 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-12 12:18:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-12 12:18:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-12 12:18:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-12 12:18:02       20 阅读

热门阅读

  1. Hive数据库:嵌入、本地、远程全攻略(下)

    2024-01-12 12:18:02       31 阅读
  2. torch.einsum用法

    2024-01-12 12:18:02       34 阅读
  3. 【大数据面试】Flink面试题附答案

    2024-01-12 12:18:02       27 阅读
  4. 常见设计模式--通俗易懂版

    2024-01-12 12:18:02       24 阅读
  5. 计算机网络——多路复用技术

    2024-01-12 12:18:02       27 阅读
  6. 编程笔记 html5&css&js 031 HTML视频

    2024-01-12 12:18:02       32 阅读
  7. 回归和拟合的关系

    2024-01-12 12:18:02       35 阅读