hive load data未正确读取到日期

1.源数据CSV文件日期字段值:

2.hive DDL语句:

CREATE EXTERNAL TABLE `test.textfile_table1`(
  `id` int COMMENT '????', 
  `name` string COMMENT '??', 
  `gender` string COMMENT '??', 
  `birthday` date COMMENT '????',.......)
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
WITH SERDEPROPERTIES ( 
  'field.delim'=',', 
  'line.delim'='\n', 
  'serialization.format'=',') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  'hdfs://ambari-hadoop1:8020/warehouse/tablespace/external/hive/test.db/textfile_table1'
TBLPROPERTIES (
  'bucketing_version'='2', 
  'discover.partitions'='true', 
  'transient_lastDdlTime'='1708312247');

3.利用LOAD DATA 加载语句加载数据后发现date日期字段未被成功加载:

 

4.猜测为日期格式问题,在hive中日期格式如下YYYY-MM-DD,而CSV中是YYYY/MM/DD:

调整后成功解决。

5.原因分析:利用dbeaver三方工具导出CSV文件后,利用WPS打开编辑保存后,YYYY-MM-DD被更改为YYYY/MM/DD导致load data失败。

相关推荐

  1. 数据读取长度不正确 python

    2024-02-20 09:42:02       24 阅读
  2. 正确利用原型继承(js的问题)

    2024-02-20 09:42:02       59 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-02-20 09:42:02       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-02-20 09:42:02       106 阅读
  3. 在Django里面运行非项目文件

    2024-02-20 09:42:02       87 阅读
  4. Python语言-面向对象

    2024-02-20 09:42:02       96 阅读

热门阅读

  1. SpringCloud微服务调用丢失请求头

    2024-02-20 09:42:02       39 阅读
  2. vscode 命令无法执行

    2024-02-20 09:42:02       43 阅读
  3. OpenCV:计算机视觉领域的瑞士军刀

    2024-02-20 09:42:02       52 阅读
  4. Go json Marshal & UnMarshal 的一点小 trick

    2024-02-20 09:42:02       54 阅读
  5. 【LeetCode-494】目标和(回溯&动归)

    2024-02-20 09:42:02       49 阅读
  6. 第13章 网络 Page749~755 asio核心类 ip::tcp::acceptor

    2024-02-20 09:42:02       44 阅读
  7. vue小记——this

    2024-02-20 09:42:02       51 阅读