StarRocks详解

2024-06-14 18:08:02
开发
6

什么是StarRocks？

StarRocks是新一代极速全场景MPP数据库（高并发数据库）。

StarRocks充分吸收关系型OLAP数据库和分布式存储系统在大数据时代的优秀研究成果。

1.可以在Spark和Flink里面处理数据，然后将处理完的数据写到StarRocks里面。

2.可以实现将数据从Hadoop倒入到StarRocks里面去，也可以将StarRocks的数据倒入到Hadoop里面，都是可以实现的。

3.可以对接ES数据库（ElasticSearch）。

4.StarRocks兼容MySQL的协议，可以通过 MySQL的客户端和常用BI工具对接StarRocks来进行数据分析。

5.StarRocks采用分布式架构，对数据表进行水平划分并且以多副本存储，集群规模可以灵活伸缩，能够支持10PB级别的数据分析，支持MPP框架，并行加速计算，支持多副本，具有弹性容错能力。

StarRocks适合什么场景？

1.OLAP多维分析：用户行为分析，用户画像，财务报表，系统监控分析。

2.实时数据分析：电商数据分析，直播质量分析，物流运单分析，广告投放分析。

3.高并发查询：广告主表分析，Dashboard多页面分析。

4.统一分析：通过使用一套系统解决上述场景，降低系统复杂度和多技术栈开发成本。

StarRocks基本概念：

1.FE：FrondEnd是StarRocks的前端节点，负责管理元数据，负责与客户端连接，进行查询规划，查询调度等工作。

2.BE：BackEnd时StarRocks的后端节点，负责数据存储，计算执行，以及Compaction，副本管理等工作。

3.Broker：Broker并不是必须出现的，当StarRocks和HDFS进行交互的时候（也就是数据从HDFS到StarRocks中和数据从StarRocks中到HDFS里面），那么StaRocks负责这个过程的中转服务，辅助提供导入导出功能。

4.StarRocksManager：StarRocks的可视化工具，提供StarRocks的集群管理，在线查询，故障查询，监控报警的可视化工具。

5.Tablet：StarRocks中表的逻辑分片，也是StarRocks中副本管理的基本单位，每个表根据分区和分桶机制被划分成多个Tablet存储在不同BE节点上。

StarRocks系统架构：

FE：

1.接受MySQL客户端的连接，解析并且执行SQL语句。

2.管理元数据，执行SQL DDL命令，用CataLog记录库，表，分区，tablet副本等信息。

3.FE高可用部署，使用复制协议选主和主从同步元数据，所有的元数据修改操作，都有FE的leader节点完成，FE的follower节点可执行读操作。元数据的读写满足顺序一致性，FE的节点数目采用2n+1，可以容忍n个节点故障，当FE leader故障的时候，可以从现有的follower节点中重新选主，完成故障切换。

4.FE中的SQL Layer对用户提交的SQL进行解析，分析，改写，语义分析和关系代数优化，生产逻辑执行计划。

5.FE中的Planner负责把逻辑计划转化为可分布式执行的物理计划，分发给一组BE。

6.FE监督BE，管理BE的上下线，根据BE的存活和健康状态，维持tablet副本的数量。

7.FE协调数据导入，保证数据导入的一致性。

BE：

1.BE管理tablet副本，tablet时table经过分区分桶形成的子表，采用列式存储。

2.BE受FE指导，创建或删除子表。

3.BE接收FE分发的物理执行计划并指定BE coordinator节点，在BE coordinator的调度下，与其他BE worker共同协作完成执行。

4.BE读本地的列存储引擎获取数据，并通过索引和谓词下沉快速过滤数据。

5.BE后台执行compact任务，减少查询时的读放大。

6.数据导入的时候，由FE指定BE coordinator，将数据以fanout的形式写入到tablet多副本所在的BE上。

StarRocks为什么快：

列式存储：StarRocks中，一张表的列可以分为维度列（key列）和指标列（value列），维度列用于分组和排序，指标列可通过聚合函数等累加起来。StarRocks可以认为是多维的key到多维指标的映射。（在写SQL的时候最好要根据表的前缀，类似于MySQL的索引最左前缀原则）

稀疏索引：当进行范围查询时，StarRocks能够快速定位到起始目标行，是因为shortkey index（稀疏索引）。

预先聚合：StarRocks支持聚合模型，维度列取值相同数据行可合并一行，合并后数据行的维度列取值不变，指标列的取值为这些数据行的聚合结果，用户需要给指标列指定聚合函数，通过预先聚合，可以加速聚合操作。

分区分桶：StarRocks的表被分为tablet，每个tablet多副本冗余存储在BE上，BE和tablet的数量可以根据计算资源和数据规模而弹性伸缩，查询时，多台BE可并行地查找tablet快速获取数据。而且tablet的副本可以复制和前一，增强了数据的可靠性，避免了数据倾斜。

列级别的索引技术：Bloomfilter可以快速判断数据块中不含所查找值，ZoneMap通过数据范围快速过滤待查找值，Bitmap索引可快速计算出枚举类型的列满足一定条件的行。

StarRocks的4种表模型：

明细模型（Duplicate key）：关注历史数据。

聚合模型（Aggregate key）：关注总量，平均值，最大值，最小值，计算一个统一的指标。

更新模型（Unique key）：设定一个主键（uid），主键是唯一的，如果主键是第一次出现在表中，那么执行插入操作，如果主键第二次出现在表中，那么执行更新操作，覆盖前一条记录。（并不是真的覆盖，其实也存着明细数据，只是将最新的一条记录返回）

主键模型（Primary key）：主键模型相当于是更新模型的升级版，速度更快一些。更新模型采用Merge on Read读时合并策略会大大限制查询功能，在主键模型更好地解决了行级的更新操作。配合Flink-connector-starrocks可以完成MySQL CDC实时同步的方案。存储引擎会为主键建立索引，导入数据时会把索引加载到内存中，所以主键模型对内存的要求更高。真正保证每个主键只有一条数据存在。

各自适用场景：

1.明细模型：

关注历史明细数据。

2.聚合模型：建表的时候注意设置分组键（ distributed by hash(site_id) ）

业务方进行查询为汇总类查询，比如sum，count，max。

不需要查看明细数据。

老数据不会被频繁修改，只会追加和新增。

3.更新模型：建表的时候注意UNIQUE KEY(create_time,order_id)

数据需要进行更新，比如拉链表。

已经写入的数据有大量的更新需求。（比如电商场景中，订单的状态经常会发生变化，没必要用明细表记录变化趋势，使用更新模型记录最新的状态即可）

需要进行实时数据分析。

4.主键模型：建表的时候注意PRIMARY KEY（user_id）

数据冷热特征：只有最近几天的数据才需要修改，老的冷数据很少需要修改，比如订单数据，老的订单完成后就不再更新，并且分区是按天进行分区的，那么在导入数据时历史分区的数据的主键就不会被加载，也就不会占用内存了，内存中仅会加载近几天的索引。

大宽表（数百列数千列）：主键只占整个数据的很小一部分，内存开销比较低。比如用户状态/画像表，虽然列非常多，但总的用户数量不大，主键索引内存占用相对可控。

原文地址:https://blog.csdn.net/weixin_53379153/article/details/139639156 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1801557198279675904.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部