hive词频统计---文件始终上传不来

目录

准备工作:

文件内容:

创建数据库及表

将文件上传到:上传到/user/hive/warehouse/db1.db/t_word目录下

hive里面查询,始终报错:(直接查询也是不行)

解决方案:


准备工作:

xshell连接主机,启动hadoop集群,启动MySQL服务已就绪

文件内容:

创建数据库及表

将文件上传到:上传到/user/hive/warehouse/db1.db/t_word目录下

尝试使用Hive的LOAD DATA语句加载数据到表:

LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;

hive里面查询,始终报错:(直接查询也是不行)

hive> LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;
FAILED: SemanticException Line 1:17 Invalid path ''/user/hive/warehouse/db1.db/t_word/word.txt'': No files matching path hdfs://mini01:8020/user/hive/warehouse/db1.db/t_word/word.txt

解决方案:

先创建目录,再将文件上传到目录下,再去加载到数据库表中,最后再去查询即可;

hadoop fs -mkdir -p /user/hive/warehouse/db1.db/t_word




hadoop fs -put word.txt /user/hive/warehouse/db1.db/t_word/



LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;

 

注意:文件重复要删除

相关推荐

  1. Python词频统计

    2024-04-04 07:46:03       33 阅读
  2. axios用封装单独图片文件

    2024-04-04 07:46:03       49 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-04 07:46:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-04 07:46:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-04 07:46:03       82 阅读
  4. Python语言-面向对象

    2024-04-04 07:46:03       91 阅读

热门阅读

  1. MySQL数据库归档工具之【pt-archiver】

    2024-04-04 07:46:03       38 阅读
  2. 在Ubuntu 18.04上如何添加交换空间

    2024-04-04 07:46:03       39 阅读
  3. 人生感悟

    2024-04-04 07:46:03       32 阅读
  4. 【python】Google 风格和 Numpy 风格 docstring

    2024-04-04 07:46:03       43 阅读
  5. List Set Map 的值能否为NUll?

    2024-04-04 07:46:03       36 阅读
  6. 2024水会|全国水科技大会第一版日程正式公布

    2024-04-04 07:46:03       35 阅读
  7. 在Gitee上创建新仓库

    2024-04-04 07:46:03       30 阅读
  8. Spring Boot整合Kafka+SSE实现实时数据展示

    2024-04-04 07:46:03       36 阅读