hive中split函数相关总结

split 函数一直再用,居然发现没有总结,遂补充一下;

split函数

在Hive中,split函数用于将一个字符串根据指定的分隔符进行分割,并返回一个数组。它的语法如下:

split(str, pat)

示例

假设有一个包含逗号分隔的字符串"apple,banana,orange",我们可以使用split函数按逗号分割这个字符串,并返回一个包含"apple"、"banana"和"orange"的数组:

SELECT split('apple,banana,orange', ',');

实战

select  
	imei
	,split(content_id,'\\_')[0] as source
	,sum(play_cnt ) as play_cnt
from  table_1
grouo by imei,split(content_id,'\\_')[0]

注意事项

1.split 分割后是形成一个数组,如果取第一个值,这个和取数组第一个值是类似的,取下标,所以第一个值的下标为0;
2.与截取函数比较substr从第1位截取到10位,是substr(contend_id,1,10),这个是从1开始的,需要区别开;
3.当涉及稍微复杂的例子时,我们可以考虑使用split函数来处理包含更多分隔符的字符串,并结合LATERAL VIEW和explode函数来展开数组;
比如以下例子:

SELECT id, prop
FROM table1
LATERAL VIEW explode(split(properties, ',')) propTable AS prop;

4.切割时,当逗号作为分隔符时,保持不变,其他多数时候要加转义,如split(properties,‘\_’),split(properties,‘,’)

相关推荐

  1. hivesplit函数相关总结

    2024-03-10 15:26:01       47 阅读
  2. hivemap相关函数总结

    2024-03-10 15:26:01       72 阅读
  3. hivearray相关函数总结

    2024-03-10 15:26:01       65 阅读
  4. hivestruct相关函数总结

    2024-03-10 15:26:01       71 阅读
  5. pythonsplit函数的用法

    2024-03-10 15:26:01       45 阅读
  6. split函数

    2024-03-10 15:26:01       56 阅读
  7. hivereverse函数

    2024-03-10 15:26:01       22 阅读
  8. hive split 特殊用法

    2024-03-10 15:26:01       29 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-10 15:26:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-10 15:26:01       101 阅读
  3. 在Django里面运行非项目文件

    2024-03-10 15:26:01       82 阅读
  4. Python语言-面向对象

    2024-03-10 15:26:01       91 阅读

热门阅读

  1. Hive表使用ORC格式和SNAPPY压缩建表语句示例

    2024-03-10 15:26:01       45 阅读
  2. k8s中storageClass存储介绍

    2024-03-10 15:26:01       34 阅读
  3. ansible使用linefile批量修改网卡配置文件及host解析

    2024-03-10 15:26:01       35 阅读
  4. ansible

    2024-03-10 15:26:01       39 阅读
  5. 自动化运维工具----Ansible playbook详解

    2024-03-10 15:26:01       47 阅读
  6. 【学习心得】webpack技术在爬虫逆向中的应用

    2024-03-10 15:26:01       42 阅读
  7. 如何学习ChatGPT?从入门到精通(附资料下载)

    2024-03-10 15:26:01       125 阅读
  8. EF框架常见异常处理汇总

    2024-03-10 15:26:01       45 阅读
  9. L1-095 分寝室(PTA)

    2024-03-10 15:26:01       32 阅读
  10. 计网|谢希仁版|第一章课后习题

    2024-03-10 15:26:01       37 阅读