【网络原理】UDP协议的报文结构及校验和字段的错误检测机制（CRC算法、MD5算法）

系列文章目录

文章目录

UDP协议

UDP协议的报文结构及注意事项

4. MD5（Message Digest Algorithm 5）

UDP协议

上一篇文章提过，UDP（User Datagram Protocol，用户数据报协议）是一种无连接的、不可靠传输、面向数据报、全双工的传输层协议，用于在网络上发送数据。

UDP的各个特点已经介绍过了，接下来，基于UDP协议的报文结构，了解该协议的各个特性。

UDP协议的报文结构及注意事项

UDP 报文结构指的就是 UDP 数据报的结构。

UDP数据报 = 报头(重点) + 载荷(实际要传输的数据部分)，如下图：

由于UDP的一个数据报的最大长度就是64KB，而64KB在当今的互联网环境下，是一个非常小的数字。

注意事项如果我们需要传输的 UDP数据报超过64KB，有以下解决方案：

将数据分割成多个 UDP数据报进行发送传输，并在接收端进行重新组装。这种方式称为数据分段（Data Segmentation）或数据分片（Data Fragmentation）。
考虑使用其他的传输层协议，如 TCP 协议。如果需要传输大量数据或者超过 UDP 最大报文长度的数据，TCP 是更好的选择，这里暂时不详细展开。

UDP报文结构中的校验和字段

校验和，顾名思义，用于验证数据在传输过程中是否传输正确（是否发生了错误或损坏）

或者说，用于数据完整性检查，以确保数据在传输过程中没有被篡改或损坏。

1. 校验和主要校验的内容

数据内容： 校验和对数据报中的每个比特位进行求和计算，以确保数据内容在传输过程中没有被篡改或损坏。
传输过程中的错误： 校验和可以检测到数据在传输过程中是否发生了错误，例如比特翻转或数据丢失。
数据包的完整性： 通过与发送端发送的校验和进行比较，接收端可以验证数据包在传输过程中是否保持完整，即数据在发送端和接收端之间没有发生改变。

如果发现数据损坏或者被篡改，就丢弃这个数据。

2. UDP校验和的实现方式

UDP校验和使用的是一种简单的错误检测机制，它的实现方式如下：

计算校验和： 发送端在发送UDP数据包之前，会对UDP数据报文的内容进行校验和的计算。计算过程通常包括以下步骤：
- 将UDP数据报文划分为以16比特为单位的字（对于字节不足16比特的部分，可以补零）。
- 将这些16比特字相加，得到一个32比特的中间结果。
- 如果中间结果的高16比特不为0，则将其与低16比特相加，直到高16比特为0为止。
- 最终的校验和就是将最后的结果按位取反得到的值。
校验和字段： 发送端将计算得到的校验和值放置在UDP数据报的校验和字段中。
接收端验证： 接收端在接收到UDP数据包后，会进行校验和的验证。验证的步骤与计算过程类似：
- 接收端同样将UDP数据报文划分为16比特的字，并对其进行求和计算。
- 接收端将计算得到的校验和与UDP数据包中的校验和字段进行比较。
- 如果两者相等，则认为数据包未损坏；如果不相等，则认为数据包可能已经损坏。

这里使用一个生活场景帮助理解上述实现过程：

当你寄送一封信件给朋友时，你可能会希望确保信件在邮递过程中没有损坏或篡改。你可以在信封上添加一个简单的校验和来实现这一点。

想象你写了一封信给朋友，然后把它放进信封里。在你封上信封之前，你可以将信中每个字母的ASCII码值相加，然后取结果的模256（即求和结果除以256的余数），并将这个余数写在信封的背面。这个余数就是你的“校验和”。
当你的朋友收到这封信时，他可以打开信封并读取信的内容。然后，他也可以将信中每个字母的ASCII码值相加，然后取结果的模256。如果这个计算得到的余数与信封背面的校验和相同，那么他可以合理地假设信件在邮递过程中没有被篡改或损坏。
这个例子简化了UDP校验和的概念，帮助理解UDP校验和的基本原理：在发送数据之前计算一个简单的校验值，并在接收数据时验证这个校验值，以确保数据的完整性和准确性。

需要注意的是，UDP校验和并不提供数据的可靠性传输，它只能检测到一部分错误，并不能保证数据的完整性或可靠性。

就拿寄信的例子来解释，假设接收端接收到的信中的内容出现变化，如其中一个a->b，另一个b->a，但此时每个字母的ASCII码值相加再取模，得到的校验和仍然是相同的。
同理，UDP校验和仅仅对UDP数据报中的数据进行简单的加法和取反操作来计算校验和值。因此，接收内容不同但计算出的校验和值是相同的情况仍然是会出现的。

综上，UDP校验和虽然可以帮助检测部分错误，但它并不足以确保数据的完整性和可靠性。因此，在需要可靠传输的场景下，通常会选择使用TCP等其他协议。

除此之外，要想提高UDP的数据的完整性检查，还可以让UDP结合一些其他错误检测和纠正的机制进行校验，如CRC（循环冗余校验）算法、MD5算法、SHA-3算法、SHA-256算法等。这里简单介绍一下CRC算法和MD5算法。

3. CRC（循环冗余校验）算法

CRC（Cyclic Redundancy Check）是一种错误检测码。它通过对数据进行多项式运算生成一个校验码，接收方使用这个校验码来验证数据的完整性。CRC算法的核心思想是利用多项式除法，将数据帧视为多项式，然后进行除法运算并取余数作为校验码。

在某些情况下，为了检测数据传输过程中是否出现错误或数据损坏，可以使用CRC算法来生成校验码，并将其附加到UDP数据报中一起传输。具体如下：

发送端在发送UDP数据报之前，可以对数据进行CRC校验，生成校验码并将其添加到UDP数据报的尾部。
接收端在接收到UDP数据报后，可以执行相同的CRC算法来计算接收到的数据的校验码，并将其与接收到的校验码进行比较。
如果两者一致，则说明数据在传输过程中没有出现错误；如果不一致，则说明数据可能已经损坏或被篡改。

可以看到，此处我们也就是将UDP原有的校验码生成方式改为了使用CRC（循环冗余校验）的方式来生成校验码。具体CRC的工作原理，建议寻找其他资料进行了解。

4. MD5（Message Digest Algorithm 5）

MD5（Message Digest Algorithm 5）是一种广泛使用的哈希函数，用于产生128位（16字节）的散列值。MD5通常用于对消息进行完整性校验或数字签名。

首先，先重点认识一下MD5的特点：

固定长度输出： MD5生成的哈希值是固定长度的，为128位（16字节），无论输入消息的长度如何。
雪崩效应： 即使输入消息的微小改变也会导致输出哈希值发生巨大变化，这种性质被称为雪崩效应，增加了数据的安全性和完整性。
不可逆性： MD5是单向哈希函数，意味着从哈希值反推原始消息是困难的，几乎不可能通过哈希值还原出原始消息。

在某些情况下，MD5可以与UDP一起使用以提高数据的完整性检查。例如，在某些应用中，可以在UDP数据报中包含MD5哈希值作为校验字段，以便在接收端验证数据的完整性。这样，接收方可以计算接收到的数据的MD5哈希值，并将其与发送端附加在UDP数据报中的MD5哈希值进行比较，以确保数据在传输过程中没有被篡改或损坏。

我们随便使用一个搜索引擎，搜索MD5，就会有对应的MD5在线工具。