Kafka Schema介绍

Avro概述

简介

Apache Avro(以下简称 Avro,读音:阿夫罗)是一个数据序列化系统,是一种与编程语言无关的序列化格式,是提供一种共享数据文件的方式。Avro是Hadoop中的一个子项目,Avro是一个基于二进制数据传输高性能的中间件。Avro可以做到将数据进行序列化,适用于远程或本地大批量数据交互。在传输的过程中Avro对数据二进制序列化后节约数据存储空间和网络传输带宽。

序列化就是将对象转换成二进制流,相应的反序列化就是将二进制流再转换成对应的对象。因此,Avro就是用来在传输数据之前,将对象转换成二进制流,然后此二进制流达到目标地址后,Avro再将二进制流转换成对象。

特点

  1. 丰富的数据结构

  2. 一个紧凑的,快速的,二进制的数据格式

  3. 一个容器文件,来存储持久化数据

  4. 远程过程调用(RPC)

  5. 简单的动态语言集成。

  6. Avro模式是使用JSON定义的 。这有助于以已经具有JSON库的语言实现。

JSON是一种轻量级的数据传输格式,对于大数据集,JSON数据会显示力不从心,因为JSON的格式是key:value型,每条记录都要附上key的名字,有的时候,光key消耗的空间甚至会超过value所占空间,这对空间的浪费十分严重,尤其是对大型数据集来说,因为它不仅不够紧凑,还要重复地加上key信息,不仅会造成存储空间上的浪费,更

相关推荐

  1. SQLMap介绍

    2023-12-06 07:10:06       26 阅读
  2. GAN 介绍

    2023-12-06 07:10:06       43 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-06 07:10:06       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-06 07:10:06       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-06 07:10:06       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-06 07:10:06       20 阅读

热门阅读

  1. Kotlin 中的 var 和 val:选择正确的变量声明

    2023-12-06 07:10:06       37 阅读
  2. 比较 Apache Hive 和 Spark

    2023-12-06 07:10:06       32 阅读
  3. JeecgBoot 框架升级 Spring Boot 3.1.5

    2023-12-06 07:10:06       36 阅读
  4. html简单的表格制作

    2023-12-06 07:10:06       35 阅读
  5. 汽车标定技术(十一)--XCP应用场景分析

    2023-12-06 07:10:06       42 阅读
  6. 企业中 Docker 的 Swarm 使用及作用详解

    2023-12-06 07:10:06       27 阅读