数仓工具—Hive语法之正则表达式函数

正则表达式函数

之前我们介绍过like rlike regexp 这些关键字,都是和匹配有关的,今天我们介绍一下hive 的REGEXP_REPLACEREGEXP_EXTRACT 函数,背景是使用Hive正则表达式函数提取数字

在我的其他文章中,我们已经看到了如何使用Hive正则表达式从字符串中提取日期值。正则表达式函数有时被称为regex。正则表达式的另一个常见用途是提取数值,例如从字符串数据中提取区号或电话号码。在本文中,我们将检查如何在Apache Hive中使用正则表达式函数提取数字。

使用Hive正则表达式函数提取数字

当您处理不同的数据源时,可能需要从给定的字符串类型列中提取数字值,如电话号码或区号。

以下正则表达式允许您获取所需的数值。

  • Hive REGEXP_REPLACE 正则表达式函数
  • Hive REGEXP_EXTRACT 正则表达式函数

现在,让我们使用这些函数从字符串类型中提取数字或数值。

使用Hive REGEXP_REPLACE提取数字

Hive REGEXP_REPLACE 函数 是获取所需值的最简单函数之一。这里的想法是用空格替换所有字母字符,除了数字或数值。

例如,考虑下面的Hive示例,用日期值替换所有字符。

sql
SELECT TRIM(REGEXP_REPLACE(string, '[^0-9]'

相关推荐

  1. 工具Hive语法表达式函数

    2024-07-14 22:28:01       21 阅读
  2. 工具Hive语法替换函数和示例

    2024-07-14 22:28:01       18 阅读
  3. Hive表达式使用

    2024-07-14 22:28:01       42 阅读
  4. 工具Hive语法宏(Macro)

    2024-07-14 22:28:01       21 阅读
  5. 工具Hive进阶StorageHandler(23)

    2024-07-14 22:28:01       60 阅读
  6. 工具Hive基础临时表及示例

    2024-07-14 22:28:01       22 阅读
  7. 表达式 - 在线工具

    2024-07-14 22:28:01       29 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 22:28:01       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 22:28:01       71 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 22:28:01       58 阅读
  4. Python语言-面向对象

    2024-07-14 22:28:01       69 阅读

热门阅读

  1. 【Lua】lua实现C# continue效果

    2024-07-14 22:28:01       17 阅读
  2. 探索TASKCTL和 DataStage 的ETL任务调度协同

    2024-07-14 22:28:01       17 阅读
  3. TCPDump协议分析工具

    2024-07-14 22:28:01       20 阅读
  4. 神领物流项目第二天

    2024-07-14 22:28:01       17 阅读
  5. 日记

    2024-07-14 22:28:01       22 阅读
  6. mmc-utils 的 MMC 测试工具

    2024-07-14 22:28:01       20 阅读