04-用户画像+sqoop使用

优点

sqoop的作用是实现数据的导入和导出,主要是对数据库和数据仓库之间的操作

只要是支持jdbc连接的数据库都可以使用sqoop操作

添加Sqoop到环境变量中

export SQOOP_HOME=/export/server/sqoop
export PATH=$PATH:$SQOOP_HOME/bin:$SQOOP_HOME/sbin

source /etc/profile

在这里插入图片描述

启动数仓服务

./up01.sh start

sqoop建表语句

create database itcast charset=utf8;
create table itcast.tb_user(
    id int,
    name varchar(20),
    age int,
    gender varchar(20)
);
insert into itcast.tb_user value(1,'张三',20,'男');

hive数仓中的准备

create database itcast;

hive表指令

  • create-hive-table 根据mysql表创建hive表
  • –connect mysql连接信息 jdbc连接
  • –username mysql用户名
  • –password mysql密码
  • –table mysql表名
  • –hive-table hive表名 需要指定库
  • –fields-terminated-by 字段分割符
/export/server/sqoop/bin/sqoop create-hive-table --connect  jdbc:mysql://192.168.88.166:3306/users --username root --password 123456 --table tbl_users --hive-table users.tbl_users --fields-terminated-by '\t'

sqoop导入数据指令

  • mysql数据导入数仓
  • import 根据mysql表创建
  • –connect mysql连接信息
  • –username 用户名
  • –password 密码
  • –table mysql表名
  • –hive-import 导入hive表
  • –hive-overwrite 覆盖导入
  • –hive-table hive表名
  • –fields-terminated-by 字段分割符
  • –delete-target-dir 如果存在表目录则删除后在再重新创建
  • –direct 直接导入模式 提升导入速度
  • –m 指定Maptask数量并行导入数据
/export/server/sqoop/bin/sqoop import --connect  jdbc:mysql://192.168.88.166:3306/users --username root --password 123456 --table tbl_users --hive-import --hive-overwrite  --hive-table users.tbl_users --fields-terminated-by '\t'  --delete-target-dir  --direct  --m  1

编写sqoop脚本

qoop脚本就是将sqoop指令写入shell文件 后缀是 .sh

在这里插入图片描述

在这里插入图片描述

建表脚本

/export/server/sqoop/bin/sqoop \
create-hive-table \
--connect jdbc:mysql://192.168.88.166:3306/users \
--username root \
--password 123456 \
--table tbl_users \
--hive-table users.tbl_users \
--fields-terminated-by '\t'

导入脚本

/export/server/sqoop/bin/sqoop \
import \
--connect  jdbc:mysql://192.168.88.166:3306/users \
--username root \
--password 123456 \
--table tbl_users \
--hive-import \
--hive-overwrite  \
--hive-table users.tbl_users \
--fields-terminated-by '\t'  \
--delete-target-dir  \
--direct  \
--m  1

在这里插入图片描述

相关推荐

  1. 什么是用户画像

    2024-07-22 09:00:05       36 阅读
  2. 2024.1.22 parse_rule.用户画像es数据使用rule规则读取

    2024-07-22 09:00:05       38 阅读
  3. sqoop的安装与使用

    2024-07-22 09:00:05       33 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-22 09:00:05       52 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-22 09:00:05       54 阅读
  3. 在Django里面运行非项目文件

    2024-07-22 09:00:05       45 阅读
  4. Python语言-面向对象

    2024-07-22 09:00:05       55 阅读

热门阅读

  1. 出口 与 无线

    2024-07-22 09:00:05       17 阅读
  2. Python3 第三十五课 -- 实例四

    2024-07-22 09:00:05       18 阅读
  3. 自动驾驶-定位概述

    2024-07-22 09:00:05       18 阅读
  4. 1.关于linux的命令

    2024-07-22 09:00:05       14 阅读
  5. 配置php-fpm服务

    2024-07-22 09:00:05       18 阅读
  6. 【机器学习框架TensorFlow和PyTorch】基本使用指南

    2024-07-22 09:00:05       15 阅读
  7. 华为eNSP模拟器安装

    2024-07-22 09:00:05       15 阅读
  8. HTTP协议的演进:从HTTP/1.0到HTTP/2.0

    2024-07-22 09:00:05       13 阅读
  9. 在Ubuntu 14.04上安装和使用Docker Compose的方法

    2024-07-22 09:00:05       16 阅读
  10. 【自动化机器学习AutoML】AutoML工具和平台的使用

    2024-07-22 09:00:05       16 阅读
  11. 【数据挖掘基础】数据挖掘技术概述和基本算法

    2024-07-22 09:00:05       16 阅读
  12. 常用传感器误差补偿方法介绍

    2024-07-22 09:00:05       15 阅读
  13. ARM/Linux嵌入式面经(十七):美团校招面经

    2024-07-22 09:00:05       15 阅读
  14. 深度学习简介(框架)

    2024-07-22 09:00:05       15 阅读