2. 《大数据之路:阿里巴巴大数据实践》学习笔记,持续更新ing

笔记链接(飞书):https://t0s016els2a.feishu.cn/docx/JrNydGljUonH1ExcGCpcoC8unTb
密码:r6@61391

该书籍部分目录如下:

第1篇 数据技术篇

第2章 日志采集

2.1 浏览器的页面日志采集
2.1.1 页面浏览日志采集流程
2.1.2 页面交互日志采集
2.1.3 页面日志的服务端清洗和预处理
2.2 无线客户端的日志采集
2.2.1 页面事件
2.2.2 控件点击及其他事件
2.2.3 特殊场景
2.2.4 H5 & Native 日志统一
2.2.5 设备标识
2.2.6 日志传输
2.3 日志采集的挑战
2.3.1 典型场景
2.3.2 大促保障

第3章 数据同步

3.1 数据同步基础
3.1.1 直连同步
3.1.2 数据文件同步
3.1.3 数据库日志解析同步
3.2 阿里数据仓库的同步方式
3.2.1 批量数据同步
3.2.2 实时数据同步
3.3 数据同步遇到的问题与解决方案
3.3.1 分库分表的处理
3.3.2 高效同步和批量同步
3.3.3 增量与全量同步的合并
3.3.4 同步性能的处理
3.3.5 数据飘移的处理

第4章 离线数据开发

第5章 实时技术

第6章 数据服务

第7章 数据挖掘

第2篇 数据模型篇

第3篇 数据管理篇

第4篇 数据应用篇

最近更新

  1. TCP协议是安全的吗?

    2024-01-31 06:56:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-31 06:56:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-31 06:56:01       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-31 06:56:01       20 阅读

热门阅读

  1. 【技术预研】StarRocks官方文档浅析(3)

    2024-01-31 06:56:01       48 阅读
  2. 【Spark系列6】如何做SQL查询优化和执行计划分析

    2024-01-31 06:56:01       30 阅读
  3. flink分别使用FilterMap和ProcessFunction实现去重逻辑

    2024-01-31 06:56:01       32 阅读
  4. 双非本科准备秋招(11.2)—— 力扣字符串

    2024-01-31 06:56:01       38 阅读
  5. 设计模式七(策略模式)

    2024-01-31 06:56:01       42 阅读
  6. 深入理解c语言printf

    2024-01-31 06:56:01       36 阅读