装箱 Box 数据类型

装箱是最简单直接的一种智能指针,它的类型是Box<T>。装箱使我们可以把数据存储到堆上,并在栈上保留一个指向堆数据的指针。装箱操作常常被用于下面的场景:

  1. 当你拥有一个无法在编译时确定大小的类型,但又想使用这个类型的值时。
  2. 当你需要传递大量数据的所有权,但又不希望产生大量数据的复制行为时。
  3. 当你希望拥有一个实现了指定trait的类型值,但又不关心具体的类型时。
fn main() {
   
    let b = Box::new(5);
    println!("b = {}", *b + 3);
    println!("b = {}", b);
}

常规引用就是一种类型的指针,你可以将指针形象地理解为一个箭头,它会指向存储在别处的某个值。

装箱类似于常规指针,也可以通过解引用来获取装箱实际的值,代码中*b就是如此。这个定义和Go中的unsafe.Pointer非常类似,所有具体类型的指针都可以用一种类型的指针来表示。

定义递归类型

RUST必须在编译时知道每一种类型占据的空间大小,但有一种递归的类型却无法在编译时被确定具体大小。比如下面例子中的链表:

use crate::List::{
   Cons, Nil};
enum List {
   
    Cons(i32, List),
    Nil,
}

fn main() {
   
    let list = Cons(1, Cons(2, Cons(3, Nil)));
}

我们尝试使用枚举来表达一个持有i32值的链表数据类型,通过不断嵌套元组的形式最终组成一个列表。

但程序无法编译通过,RUST认为这个类型拥有无限大小,无法确认类型所占用的存储空间大小。

enum Message {
   
    Quit,
    Move {
    x: i32, y: i32 },
    Write(String),
    ChangeColor(i32, i32, i32),
}

RUST如何计算Message类型的大小?为了计算Message值需要多大的存储空间,RUST会遍历枚举中的每一个成员来找到需要最大空间的那个变体。Message::Quit不需要占用任何空间,Message::Move需要两个存储i32值的空间,以此类推。

因为指针大小是恒定的,要改变这样无穷递归的情况,就应该将Cons变体中存放一个Box<T>而不是直接存放另外一个List值,而Box<T>则会指向下一个List并存储在堆上。

use crate::List::{
   Cons, Nil};
enum List {
   
    Cons(i32, Box<List>),
    Nil,
}

fn main() {
   
    let list = Cons(1, Box::new(Cons(2, Box::new(Cons(3, Box::new(Nil))))));
}

新的Cons变体中需要一部分存储i32的空间和一部分存储装箱指针的空间,这样调整之后,List值都只需要占用一个i32值加上一个装箱指针的空间。通过使用装箱,我们打破了无限递归的过程,进而使编译器可以计算出List值所占用的空间。

Box<T>属于智能指针的一种,因为它实现了Defer trait,所以允许我们将Box<T>的值当做引用来对待。当一个Box<T>值离开作用域时,因为它实现了Drop trait,所以Box<T>指向的堆数据会自动地被清理释放。==

实现 Defer trait将类型视作引用

定义我们自己的智能指针,Box<T>类型最终被定义为拥有两个元素的元组结构体。结构体给Deref trait实现了defef方法,该方法会借用self并返回一个指向元素第一个元素的引用。

RUST所有权系统决定了deref方法需要返回一个引用。假设deref方法使编译器直接返回了值而不是指向值的引用,那么这个值就会被移除self。在大多数使用解引用运算符的场景下,我们并不希望获取MyBox<T>内部值的所有权。

type Target = T 定义了Deref trait的一个关联类型。我们在deref方法体中返回指向第一个元素的引用,进而允许调用者通过*运算符访问值。

use std::ops::Deref;

struct MyBox<T>(T, T);

impl<T> MyBox<T> {
   
    fn new(x: T, y: T) -> MyBox<T> {
   
        MyBox(x, y)
    }
}

impl<T> Deref for MyBox<T> {
   
    type Target = T;

    fn deref(&self) -> &Self::Target {
   
        &self.0
    }
}

fn hello(language: &str) {
   
    println!("Hello, {}", language)
}

fn main() {
   
    let m = MyBox::new(String::from("Rust"), String::from("Go"));
    hello(&m);
}

在没有Deref trait的情况下,编译器只能对&形式的常规引用执行解引用操作。deref方法使编译器可以从任何实现了Deref的类型中获取值,并能够调用deref方法来获取一个可以进行解引用的引用。

解引用转换(deref coercion)是RUST为函数和方法的参数提供的一种便捷特性。当某个类型T实现了Deref trait时,它能够将T的引用转换为T经过Deref操作之后的引用。

函数hello接收&str字符串切片类型,自定义MyBox<T>自动解引用为元组第一个元素的引用&String。函数体需要&str类型,但现在传入的是&String类型,为什么编译依然能够通过呢?

能够使用&String的原因也是因为解引用操作,编译器可以自动将&String类型的参数强制转换为&str类型。

解引用转换与可变性

使用Deref trait能够重载不可变引用的*运算符,与之类似,使用DerefMut trait能够重载可变引用*运算符。

RUST会在类型与trait满足下面三种情形下执行解引用转换:

  • T: Deref<Traget=U>时,允许&T转换为&U
  • T: DerefMut<Target=U>时,允许&mut T转换为&mut U
  • T: Deref<Target=U>时,允许&mut T转换为&U

第三种情况,RUST会将一个可变引用转换为一个不可变引用。但这个过程绝对不可逆,也就是说不可变引用永远不可能转换为可变引用。因为按照借用规则,如果存在一个可变引用,那么它就必须是唯一的引用,否则程序无法编译通过。

Drop trait在清理时运行代码

我们可以通过实现Drop trait来指定值离开作用域时需要运行的代码。Drop trait要求实现一个接收self可变引用作为参数的drop函数。

Go语言中的defer也有类似的能力,在离开作用域时执行代码。

struct CustomSmartPointer {
   
    data: String,
}

impl Drop for CustomSmartPointer {
   
    fn drop(&mut self) {
   
        println!("Dropping CustomSmartPoint with data {}", self.data)
    }
}

fn main() {
   
    let c = CustomSmartPointer {
   
        data: String::from("my stuff"),
    };
    let d = CustomSmartPointer {
   
        data: String::from("other stuff"),
    };
    // drop(c);
    println!("main")
}

这段代码没有显示地将Drop trait引入作用域,因为它已经被包含在预导入模块中。RUST会在实例离开作用域时自动调用我们编写的drop代码。因为变量的丢弃顺序与创建顺序相反,所以,dc之前被丢弃。

RUST并不允许我们手动调用Drop traitdrop方法,因为自动和手动会两次触发drop,这种行为试图对同一个值清理两次而导致重复释放(double free)错误。

如果需要提前清理一个值,可以调用标准库中的std::mem:drop函数来提前清理某个值。代码注释部分的代码就用来提前清理c

使用Drop无需担心正在使用的值被意外清理掉:所有权系统会保证所有引用的有效性,而drop只会在确定不使用这个值时被调用一次。

相关推荐

  1. 装箱 Box 数据类型

    2023-12-09 19:20:06       37 阅读
  2. 用 C 语言模拟 Rust 的 Box 类型

    2023-12-09 19:20:06       20 阅读
  3. <span style='color:red;'>BOM</span>

    BOM

    2023-12-09 19:20:06      25 阅读
  4. `Box<T>`

    2023-12-09 19:20:06       28 阅读
  5. 【代码】数据类型之基本数据类型

    2023-12-09 19:20:06       6 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-09 19:20:06       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-09 19:20:06       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-09 19:20:06       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-09 19:20:06       20 阅读

热门阅读

  1. Linux 常用命令

    2023-12-09 19:20:06       41 阅读
  2. 从视频中截取指定帧图片

    2023-12-09 19:20:06       41 阅读
  3. Qt 编译fcitx-qt5 插件支持中文输入法

    2023-12-09 19:20:06       31 阅读
  4. 考研真题数据结构

    2023-12-09 19:20:06       32 阅读
  5. 第19章 正则表达式 - C++

    2023-12-09 19:20:06       36 阅读
  6. 关于锁的粒度问题——面试

    2023-12-09 19:20:06       38 阅读
  7. python 学习笔记20 批量修改页眉页脚

    2023-12-09 19:20:06       38 阅读
  8. 死锁产生的原因和预防

    2023-12-09 19:20:06       42 阅读