SQL158 每类视频近一个月的转发量/率

描述

用户-视频互动表tb_user_video_log

id uid video_id start_time end_time if_follow if_like if_retweet comment_id
1 101 2001 2021-10-01 10:00:00 2021-10-01 10:00:20 0 1 1 NULL
2 102 2001 2021-10-01 10:00:00 2021-10-01 10:00:15 0 0 1 NULL
3 103 2001 2021-10-01 11:00:50 2021-10-01 11:01:15 0 1 0 1732526
4 102 2002 2021-09-10 11:00:00 2021-09-10 11:00:30 1 0 1 NULL
5 103 2002 2021-10-01 10:59:05 2021-10-01 11:00:05 1 0 0 NULL

(uid-用户ID, video_id-视频ID, start_time-开始观看时间, end_time-结束观看时间, if_follow-是否关注, if_like-是否点赞, if_retweet-是否转发, comment_id-评论ID)

短视频信息表tb_video_info

id video_id author tag duration release_time
1 2001 901 影视 30 2021-01-01 07:00:00
2 2002 901 美食 60 2021-01-01 07:00:00
3 2003 902 旅游 90 2020-01-01 07:00:00

(video_id-视频ID, author-创作者ID, tag-类别标签, duration-视频时长, release_time-发布时间)

问题:统计在有用户互动的最近一个月(按包含当天在内的近30天算,比如10月31日的近30天为10.2~10.31之间的数据)中,每类视频的转发量和转发率(保留3位小数)。

:转发率=转发量÷播放量。结果按转发率降序排序。

输出示例

示例数据的输出结果如下

tag retweet_cut retweet_rate
影视 2 0.667
美食 1 0.500

解释:

由表tb_user_video_log的数据可得,数据转储当天为2021年10月1日。近30天内,影视类视频2001共有3次播放记录,被转发2次,转发率为0.667;美食类视频2002共有2次播放记录,1次被转发,转发率为0.500。

示例1

输入:

DROP TABLE IF EXISTS tb_user_video_log, tb_video_info;
CREATE TABLE tb_user_video_log (
    id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',
    uid INT NOT NULL COMMENT '用户ID',
    video_id INT NOT NULL COMMENT '视频ID',
    start_time datetime COMMENT '开始观看时间',
    end_time datetime COMMENT '结束观看时间',
    if_follow TINYINT COMMENT '是否关注',
    if_like TINYINT COMMENT '是否点赞',
    if_retweet TINYINT COMMENT '是否转发',
    comment_id INT COMMENT '评论ID'
) CHARACTER SET utf8 COLLATE utf8_bin;

CREATE TABLE tb_video_info (
    id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',
    video_id INT UNIQUE NOT NULL COMMENT '视频ID',
    author INT NOT NULL COMMENT '创作者ID',
    tag VARCHAR(16) NOT NULL COMMENT '类别标签',
    duration INT NOT NULL COMMENT '视频时长(秒数)',
    release_time datetime NOT NULL COMMENT '发布时间'
)CHARACTER SET utf8 COLLATE utf8_bin;

INSERT INTO tb_user_video_log(uid, video_id, start_time, end_time, if_follow, if_like, if_retweet, comment_id) VALUES
   (101, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:20', 0, 1, 1, null)
  ,(102, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:15', 0, 0, 1, null)
  ,(103, 2001, '2021-10-01 11:00:50', '2021-10-01 11:01:15', 0, 1, 0, 1732526)
  ,(102, 2002, '2021-09-10 11:00:00', '2021-09-10 11:00:30', 1, 0, 1, null)
  ,(103, 2002, '2021-10-01 10:59:05', '2021-10-01 11:00:05', 1, 0, 0, null);

INSERT INTO tb_video_info(video_id, author, tag, duration, release_time) VALUES
   (2001, 901, '影视', 30, '2021-01-01 7:00:00')
  ,(2002, 901, '美食', 60, '2021-01-01 7:00:00')
  ,(2003, 902, '旅游', 90, '2020-01-01 7:00:00');

输出:

影视|2|0.667
美食|1|0.500

答案

解题步骤:

  1. 确定时间范围:首先,我们需要找出最近一个月的截止日期,然后根据这个日期向前推算30天,得到统计的时间范围。
  2. 用户互动定义:题目中未明确用户互动的定义,我们假设用户观看视频的行为即为用户互动,且tb_user_video_log表中的start_timeend_time字段分别表示视频观看的开始和结束时间。
  3. 视频转发量:假设if_retweet = 1表示用户对视频进行了转发,a.id是日志的唯一标识。
  4. 视频观看次数:统计每类视频在指定时间范围内被观看的独立记录数,假设start_time != end_time表示有效的视频观看记录。
  5. 计算转发率:转发率 = 转发量 / 观看次数。

SELECT  tag
       ,COUNT(distinct if(if_retweet = 1,a.id,null ))                                                                  AS retweet_cut
       ,round (COUNT(distinct if(if_retweet = 1,a.id,null )) /COUNT(distinct if(start_time != end_time,a.id,null)) ,3) AS retweet_rate
FROM tb_user_video_log a
JOIN
(
	SELECT  MAX(end_time) end_time_max
	FROM tb_user_video_log
) b
ON a.end_time >= DATE_SUB(b.end_time_max, INTERVAL 30 DAY)
LEFT JOIN tb_video_info c
ON a.video_id = c.video_id
GROUP BY  tag
ORDER BY  retweet_cut desc

```

最近更新

  1. TCP协议是安全的吗?

    2024-06-06 11:58:02       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-06 11:58:02       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-06 11:58:02       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-06 11:58:02       18 阅读

热门阅读

  1. 通过电脑查看Wi-Fi密码的方法,提供三种方式

    2024-06-06 11:58:02       7 阅读
  2. 固定数量点云采样算法

    2024-06-06 11:58:02       8 阅读
  3. 自然语言处理(NLP)中的迁移学习

    2024-06-06 11:58:02       8 阅读
  4. 只需三步,使用 KRaft 建立多节点 Kafka 集群

    2024-06-06 11:58:02       12 阅读
  5. vue进阶

    2024-06-06 11:58:02       8 阅读
  6. Github 2024-06-02 开源项目日报Top10

    2024-06-06 11:58:02       10 阅读