Rust入坑指南:千人千构

坑越来越深了,在坑里的同学让我看到你们的双手!

前面我们聊过了Rust最基本的几种数据类型。不知道你还记不记得,如果不记得可以先复习一下。上一个坑挖好以后,有同学私信我说坑太深了,下来的时候差点崴了脚。我只能对他说抱歉,下次还有可能更深。不过这篇文章不会那么深了,本文我将带大家探索Structs和Enums这两个坑,没错,是双坑。是不是很惊喜?好了,言归正传。我们先来介绍Structs。

Structs

Structs在许多语言里都有,是一种自定义的类型,可以类比到Java中的类。Rust中使用Structs使用的是struct关键字。例如我们定义一个用户类型。

1struct User {
2    username: String,
3    email: String,
4    sign_in_count: u64,
5    active: bool,
6}

初始化时可以直接将上面对应的数据类型替换为正确的值。

1fn build_user(email: String, username: String) -> User {
2    User {
3        email: email,
4        username: username,
5        active: true,
6        sign_in_count: 1,
7    }
8}

下面仔细观察这 email: emailusername: username 这两行代码,有没有觉得有点麻烦?,如果User的所有属性值都是从函数参数传进来,那么我们每个参数名都要重复一遍。还好Rust为我们提供了语法糖,可以省去一些代码。

初始化Struct时省去变量名

对于上面的初始化代码,我们可以做一些简化。

1fn build_user(email: String, username: String) -> User {
2    User {
3        email,
4        username,
5        active: true,
6        sign_in_count: 1,
7    }
8}

你可以认为这是Rust的一个语法糖,当变量名和字段名相同时,初始化Struct的时候就可以省略变量名。让开发者不必做过多无意义的重复工作(写两遍email)。

在其他实例的基础上创建Struct

除了上面的语法糖以外,在创建Struct时,Rust还提供了另一个语法糖,例如我们新建一个user2,它只有邮箱和用户名与user1不同, 其他属性都相同,那么我们可以使用如下代码:

 1#![allow(unused_variables)]
 2fn main() {
 3struct User {
 4    username: String,
 5    email: String,
 6    sign_in_count: u64,
 7    active: bool,
 8}
 9
10let user1 = User {
11    email: String::from("someone@example.com"),
12    username: String::from("someusername123"),
13    active: true,
14    sign_in_count: 1,
15};
16
17let user2 = User {
18    email: String::from("another@example.com"),
19    username: String::from("anotherusername567"),
20    ..user1
21};
22}

这里的 ..user1 表示剩下的字段的值都和user1相同。

Tuple Struct

接下来再来介绍两个特殊形式的Struct,一种是Tuple Struct,定义时与Tuple相似

1struct Color(i32, i32, i32);
2struct Point(i32, i32, i32);

它与Tuple的不同在于,你可以赋予Tuple Struct一个有意义的名字,而不只是无意义的一堆值。需要注意的是,这里我们定义的Color和Point是两种不同的类型,它们之间不能互相赋值。另外,如果你想要取得Tuple Struct中某个字段的值,和Tuple一样,使用 . 即可。

空字段Struct

这里还有一种特殊的Struct,即没有字段的Struct。它叫做类单元结构(unit-like structs)。这种结构体一般用于实现某些特征,但又没有需要存储的数据。

Struct 方法

方法和函数非常相似,不同之处在于,定义方法时,必须有与之关联的Struct,并且方法的第一个参数必须是self。我们先来看一下如何定义一个方法:

 1struct Rectangle {
 2    width: u32,
 3    height: u32,
 4}
 5
 6impl Rectangle {
 7    fn area(&self) -> u32 {
 8        self.width * self.height
 9    }
10}

我们提到,方法必须与Struct关联,这里使用 impl 关键字定义一段指定Struct的实现代码,然后在这个代码块中定义Struct相关的方法,注意我们的area方法符合规则,第一个参数是self。调用时只需要用 . 就可以。

1fn main() {
2    let rect1 = Rectangle { width: 30, height: 50 };
3    rect1.area();
4}

这里的 &self 其实是代替了 rectangle: &Rectangle ,至于这里为什么要使用&符号,我们在前文已经做了介绍。当然,这里self也不是必须要加&符号,你可以认为它是一个正常的参数,根据需要来使用。

有些同学可能会有些困惑,我们已经有了函数了,为什么还要使用方法?这其实主要是为了代码的结构。我们需要将Struct实例可以做的操作都放到impl实现代码块中,方便修改和查找。而使用函数则可能存在开发人员随便找个位置来定义的尴尬情况,这对于后期维护代码的开发人员来讲将是一种灾难。

现在我们已经知道,方法必须定义在impl代码块中,且第一个参数必须是self,但有时你会在Impl代码块中看到第一个参数不是self的,而且Rust也允许这种行为。

1impl Rectangle {
2    fn square(size: u32) -> Rectangle {
3        Rectangle { width: size, height: size }
4    }
5}

这是什么情况?刚才说的不对?其实不然,这种函数叫做相关函数(associated functions)。它仍然是函数,而不是方法并且直接和Struct相关,类似于Java中的静态方法。调用时直接使用双冒号( :: ),我们之前见过很多次的 String::from("Hi") 就是String的相关函数。

最后提一点,Rust支持为一个Struct定义多个实现代码块。但是我们并不推荐这样使用。

至此,第一个坑Struct就挖好了,接下来就是第二个坑Enum。

Enum

很多编程语言都支持枚举类型,Rust也不例外。因此枚举对于大部分开发人员来说并不陌生,这里我们简单介绍一些使用方法及特性。

先来看一下Rust中如何定义枚举和获取枚举值。

1enum IpAddrKind {
2    V4,
3    V6,
4}
5
6let six = IpAddrKind::V6;
7let four = IpAddrKind::V4;

这里的例子只是最简单的定义枚举的方法,每个枚举的值也可以关联其他类型的的值。例如

1enum Message {
2    Quit,
3    Move { x: i32, y: i32 },
4    Write(String),
5    ChangeColor(i32, i32, i32),
6}

此外,Enum也可以像Struct拥有impl代码块,你也可以在里面定义方法。

Option枚举

Option是Rust标准库中定义的一个枚举。如果你用过Java8的话,一定知道一个Optional类,专门用来处理null值。Rust中是不存在null值的,因为它太容易引起bug了。但如果确实需要的时候怎么办呢,这就需要Option枚举登场了。我们先来看一看它的定义:

1enum Option {
2    Some(T),
3    None,
4}

很简单对不对。它是一个枚举,只有两个值,一个是Some,一个是None,其中Some还关联了一个类型T的值,这个T类似于Java中的泛型,即它可以是任意类型。

在使用时,可以直接使用Some或None,前面不用加 Option:: 。当你使用None时,必须要指定T的具体类型。

1let some_number = Some(5);
2let some_string = Some("a string");
3
4let absent_number: Option = None;

需要注意的是Option与T并不是相同的类型。你可以在官方文档中查看从Option中提取出T的方法。

match流程控制

Rust有一个很强大的流程控制操作叫做match,它有些类似于Java中的switch。首先匹配一系列的模式,然后执行相应的代码。与Java中switch不同的是,switch只能支持数值/枚举类型(现在也可以支持字符串),match可以支持任意类型。

 1enum Coin {
 2    Penny,
 3    Nickel,
 4    Dime,
 5    Quarter,
 6}
 7
 8fn value_in_cents(coin: Coin) -> u8 {
 9    match coin {
10        Coin::Penny => 1,
11        Coin::Nickel => 5,
12        Coin::Dime => 10,
13        Coin::Quarter => 25,
14    }
15}

此外,match还可以支持模式中绑定值。

 1enum UsState {
 2    Alabama,
 3    Alaska,
 4    // --snip--
 5}
 6
 7enum Coin {
 8    Penny,
 9    Nickel,
10    Dime,
11    Quarter(UsState),
12}
13
14fn value_in_cents(coin: Coin) -> u8 {
15    match coin {
16        Coin::Penny => 1,
17        Coin::Nickel => 5,
18        Coin::Dime => 10,
19        Coin::Quarter(state) => {
20            println!("State quarter from {:?}!", state);
21            25
22        },
23    }
24}

match与Option

前面我们聊到了从Option中提取T的值,我们来介绍一种通过match提取的方法。

 1fn plus_one(x: Option) -> Option {
 2    match x {
 3        None => None,
 4        Some(i) => Some(i + 1),
 5    }
 6}
 7
 8let five = Some(5);
 9let six = plus_one(five);
10let none = plus_one(None);

这种方法在参数中必须声明T的具体类型,这里再思考一个问题,如果我们确定x一定不会是None,那么可不可以去掉None的那个条件?

_占位符

答案是不可以,Rust要求match必须列举出所有可能的条件。例如,如果一个u8类型的,就需要列举0到255这些条件。这样做的话,可能一天也写不了几个match语句吧。所以Rust又给我们准备了一个语法糖。

针对上述情况,就可以写成下面这样:

1let some_u8_value = 0u8;
2match some_u8_value {
3    1 => println!("one"),
4    3 => println!("three"),
5    5 => println!("five"),
6    7 => println!("seven"),
7    _ => (),
8}

我们只需要列举我们关心的几种情况,然后用占位符 _ 表示剩余所有情况。看到这我只想感叹一句,这糖真甜啊。

if let

对于我们只关心一个条件的match来讲,还有一种更加简洁的语法,那就是if let。

举个栗子,我们只想要Option中值为3时打印相关信息,利用我们已经掌握的知识,可以这样写。

1let some_u8_value = Some(0u8);
2match some_u8_value {
3    Some(3) => println!("three"),
4    _ => (),
5}

如果用if let呢,就会更加简洁一些。

1if let Some(3) = some_u8_value {
2    println!("three");
3}

这里要注意,当match只有一个条件时,才可以使用if let替代。

有同学可能会问,既然叫if let,那么有没有else条件呢?答案是有的。对于下面这种情况

1let mut count = 0;
2match coin {
3    Coin::Quarter(state) => println!("State quarter from {:?}!", state),
4    _ => count += 1,
5}

如果替换成if let语句,应该是

1let mut count = 0;
2if let Coin::Quarter(state) = coin {
3    println!("State quarter from {:?}!", state);
4} else {
5    count += 1;
6}

总结

第二个坑也挖好了,来总结一下吧。本文我们首先介绍了Struct,它类似于Java中的类,可以供开发人员自定义类型。然后介绍了两种初始化Struct时的简化代码的方法。接着是定义Struct相关的方法。在介绍完Struct以后,紧接着又介绍了大家都很熟悉的Enum枚举类型。重点说了Rust中特殊的枚举Option,然后介绍了match和if let这两种流程控制语法。

最后,按照国际惯例,我还是要诚挚的邀请你早日入坑。坑里真的是冬暖夏凉~