參考循環會導致記憶體泄漏

意外情況下，執行程式時可能會產生永遠不會被清除的記憶體（通稱為記憶體泄漏／memory leak）。Rust 的記憶體安全性雖然可以保證令這種情況難以發生，但並非絕不可能。雖然 Rust 在編譯時可以保證做到禁止資料競爭（data races），但它無法保證完全避免記憶體泄漏，這是因為對 Rust 來說，記憶體泄漏是屬於安全範疇內的（memory safe）。透過使用 Rc<T> 和 RefCell<T> ，我們能觀察到 Rust 允許使用者自行產生記憶體泄漏：因為使用者可以產生兩個參考並互相參照，造成一個循環。這種情況下會導致記憶體泄漏，因為循環中的參考計數永遠不會變成 0，所以數值永遠不會被釋放。

產生參考循環

讓我們看看參考循環是怎麼發生的，以及如何避免它。我們從範例 15-25 的 List 列舉定義與一個 tail 方法開始：

檔案名稱：src/main.rs

use crate::List::{Cons, Nil};
use std::cell::RefCell;
use std::rc::Rc;

#[derive(Debug)]
enum List {
    Cons(i32, RefCell<Rc<List>>),
    Nil,
}

impl List {
    fn tail(&self) -> Option<&RefCell<Rc<List>>> {
        match self {
            Cons(_, item) => Some(item),
            Nil => None,
        }
    }
}

fn main() {}

範例 15-25：一個 cons list 定義並持有 RefCell<T>，所以我們可以修改 Cons 變體參考的值

我們用的是範例 15-5 中 List 的另一種定義寫法。Cons 變體的第二個元素現在是 RefCell<Rc<List>>，代表不同於範例 15-24 那樣能修改 i32 數值，我們想要能修改 Cons 變體指向的 List 數值。我們也加了一個 tail 方法讓我們如果有 Cons 變體的話，能方便取得第二個項目。

在範例 15-26 我們要加入 main 函式並使用範例 15-25 的定義。此程式碼建立了列表 a 與指向列表 a 的列表 b。然後它修改了列表 a 來指向 b，因而產生循環參考。在程序過程中 println! 陳述式會顯示不同位置時的參考計數。

檔案名稱：src/main.rs

use crate::List::{Cons, Nil};
use std::cell::RefCell;
use std::rc::Rc;

#[derive(Debug)]
enum List {
    Cons(i32, RefCell<Rc<List>>),
    Nil,
}

impl List {
    fn tail(&self) -> Option<&RefCell<Rc<List>>> {
        match self {
            Cons(_, item) => Some(item),
            Nil => None,
        }
    }
}

fn main() {
    let a = Rc::new(Cons(5, RefCell::new(Rc::new(Nil))));

    println!("a 初始參考計數 = {}", Rc::strong_count(&a));
    println!("a 下個項目 = {:?}", a.tail());

    let b = Rc::new(Cons(10, RefCell::new(Rc::clone(&a))));

    println!("a 在 b 建立後的參考計數 = {}", Rc::strong_count(&a));
    println!("b 初始參考計數 = {}", Rc::strong_count(&b));
    println!("b 下個項目 = {:?}", b.tail());

    if let Some(link) = a.tail() {
        *link.borrow_mut() = Rc::clone(&b);
    }

    println!("b 在變更 a 後的參考計數 = {}", Rc::strong_count(&b));
    println!("a 在變更 a 後的參考計數 = {}", Rc::strong_count(&a));

    // 取消下一行的註解可以看到循環產生
    // 這會讓堆疊溢位
    // println!("a 下個項目 = {:?}", a.tail());
}

範例 15-26：透過兩個彼此指向對方的 List 數值來產生參考循環

我們在變數 a 建立了一個 Rc<List> 實例的 List 數值並持有 5, Nil 初始列表的。我們然後在變數 b 建立另一個 Rc<List> 實例的 List 數值並持有數值 10 與指向的列表 a。

我們將 a 修改為指向 b 而非 Nil 來產生循環。我們透過使用 tail 方法來取得 a 的 RefCell<Rc<List>> 參考，並放入變數 link 中。然後我們對 RefCell<Rc<List>> 使用 borrow_mut 方法來改變 Rc<List> 的值，從數值 Nil 改成 b 的 Rc<List>。

當我們執行此程式並維持將最後一行的 println! 註解掉的話，我們會得到以下輸出：

$ cargo run
   Compiling cons-list v0.1.0 (file:///projects/cons-list)
    Finished dev [unoptimized + debuginfo] target(s) in 0.53s
     Running `target/debug/cons-list`
a 初始參考計數 = 1
a 下個項目 = Some(RefCell { value: Nil })
a 在 b 建立後的參考計數 = 2
b 初始參考計數 = 1
b 下個項目 = Some(RefCell { value: Cons(5, RefCell { value: Nil }) })
b 在變更 a 後的參考計數 = 2
a 在變更 a 後的參考計數 = 2

在我們變更列表 a 來指向 b 後，a 和 b 的 Rc<List> 實例參考計數都是 2。在 main 結束後，Rust 會釋放 b，讓 b 的 Rc<List> 實例計數從 2 減到 1。此時堆積上 Rc<List> 的記憶體還不會被釋放，因爲參考計數還有 1，而非 0。然後 Rust 釋放 a，讓 a 的 Rc<List> 實例也從 2 減到 1。此實例的記憶體也不會被釋放，因爲另一個 Rc<List> 的實例仍然參考著它。列表配置的記憶體會永遠不被釋放。為了視覺化參考循環，我們用圖示 15-4 表示。

圖示 15-4：列表 a 與 b 彼此指向對方的參考循環

如果你解除最後一個 println! 的註解並執行程式的話，Rust 會嘗試印出此循環，因為 a 會指向 b 會指向 a 以此循環下去，直到堆疊溢位（stack overflow）。

比起真實世界的程式，此循環造成的影響並不嚴重。因為當我們建立完循環參考，程式就結束了。不過要是有個更複雜的程式配置了大量的記憶體而產生循環，並維持很長一段時間的話，程式會用到比原本預期還多的記憶體，並可能壓垮系統，導致它將記憶體用光。

要產生循環參考並不是件容易的事，但也不是絕對不可能。如果你有包含 Rc<T> 數值的 RefCell<T> 數值，或是有類似具內部可變性與參考計數巢狀組合的話，你必須確保不會產生循環參考，你無法依靠 Rust 來檢查它們。產生循環參考是程式中的邏輯錯誤，你需要使用自動化測試、程式碼審查以及其他軟體開發技巧來最小化問題。

另一個避免參考循環的解決辦法是重新組織你的資料結構，確定哪些參考要有所有權，哪些參考不用。這樣一來，循環會由一些有所有權的關係與沒有所有權的關係所組成，而只有所有權關係能影響數值是否能被釋放。在範例 15-25 中。我們永遠會希望 Cons 變體擁有它們的列表，所以重新組織資料結構是不可能的。讓我們看看一個由父節點與子節點組成的圖形結構，來看看無所有權的關係何時適合用來避免循環參考。

避免參考循環：將 `Rc<T>` 轉換成 `Weak<T>`

目前，我們解釋過呼叫 Rc::clone 會增加 Rc<T> 實例的 strong_count，而 Rc<T> 只會在 strong_count 為 0 時被清除。你也可以對 Rc<T> 實例呼叫 Rc::downgrade 並傳入 Rc<T> 的參考來建立弱參考（weak reference）。強參考是你分享 Rc<T> 實例的方式。弱參考不會表達所有權關係，它們的計數與 Rc<T> 的清除無關。它們不會造成參考循環，因為弱參考的循環會在其強參考計數歸零時解除。

當你呼叫 Rc::downgrade 時，你會得到一個型別為 Weak<T> 的智慧指標。不同於對 Rc<T> 實例的 strong_count 增加 1，呼叫 Rc::downgrade 會對 weak_count 增加 1。Rc<T> 型別使用 weak_count 來追蹤有多少 Weak<T> 的參考存在，這類似於 strong_count。不同的地方在於 weak_count 不需要歸零才能將 Rc<T> 清除。

由於 Weak<T> 的參考數值可能會被釋放，要對 Weak<T> 指向的數值做任何事情時，你都必須確保該數值還存在。你可以透過對 Weak<T> 實例呼叫 upgrade 方法，這會回傳 Option<Rc<T>>。如果 Rc<T> 數值還沒被釋放的話，你就會得到 Some；而如果 Rc<T> 數值已經被釋放的話，就會得到 None。因為 upgrade 回傳 Option<Rc<T>>，Rust 會確保 Some 與 None 的分支都有處理好，所以不會取得無效指標。

為了做示範，與其使用知道下一項的列表的例子，我們會建立一個樹狀結構，每一個項目會知道它們的子項目以及它們的父項目。

建立樹狀資料結構：帶有子節點的 `Node`

首先我們建立一個帶有節點的樹，每個節點知道它們的子節點。我們會定義一個結構體 Node 來存有它自己的 i32 數值以及其子數值 Node 的參考：

檔案名稱：src/main.rs

use std::cell::RefCell;
use std::rc::Rc;

#[derive(Debug)]
struct Node {
    value: i32,
    children: RefCell<Vec<Rc<Node>>>,
}

fn main() {
    let leaf = Rc::new(Node {
        value: 3,
        children: RefCell::new(vec![]),
    });

    let branch = Rc::new(Node {
        value: 5,
        children: RefCell::new(vec![Rc::clone(&leaf)]),
    });
}

我們想要 Node 擁有自己的子節點，而且我們想要透過變數分享所有權，讓我們可以在樹中取得每個 Node。為此我們定義 Vec<T> 項目作為型別 Rc<Node> 的數值。我們還想要能夠修改哪些節點才是該項目的子節點，所以我們將 children 中的 Vec<Rc<Node>> 加進 RefCell<T>。

接著，我們使用我們定義的結構體來建立一個 Node 實例叫做 leaf，其數值為 3 且沒有子節點；我們再建立另一個實例叫做 branch，其數值為 5 且有個子節點 leaf。如範例 15-27 所示：

檔案名稱：src/main.rs

use std::cell::RefCell;
use std::rc::Rc;

#[derive(Debug)]
struct Node {
    value: i32,
    children: RefCell<Vec<Rc<Node>>>,
}

fn main() {
    let leaf = Rc::new(Node {
        value: 3,
        children: RefCell::new(vec![]),
    });

    let branch = Rc::new(Node {
        value: 5,
        children: RefCell::new(vec![Rc::clone(&leaf)]),
    });
}

範例 15-27：建立一個沒有子節點的 leaf 節點與一個有 leaf 作為子節點的 branch 節點

我們克隆 leaf 的 Rc<Node> 並存入 branch，代表 leaf 的 Node 現在有兩個擁有者：leaf 和 branch。我們可以透過 branch.children 從 branch 取得 leaf，但是從 leaf 無法取得 branch。原因是因為 leaf 沒有 branch 的參考且不知道它們之間是有關聯的。我們想要 leaf 能知道 branch 是它的父節點。這就是我們接下來要做的事。

新增從子節點到父節點的參考

要讓子節點意識到它的父節點，我們需要在我們的 Node 結構體定義中加個 parent 欄位。問題在於 parent 應該要是什麼型別。我們知道它不能包含 Rc<T>，因為那就會造成參考循環，leaf.parent 就會指向 branch 且 branch.children 就會指向 leaf，導致同名的 strong_count 數值無法歸零。

讓我們換種方式思考此關係，父節點必須擁有它的子節點，如果父節點釋放的話，它的子節點也應該要被釋放。但子節點不應該擁有它的父節點，如果我們釋放子節點的話，父節點應該要還存在。這就是弱參考的使用時機！

所以與其使用 Rc<T>，我們使用 Weak<T> 來建立 parent 的型別，更明確的話就是 RefCell<Weak<Node>>。現在我們的 Node 結構體定義看起來會像這樣：

檔案名稱：src/main.rs

use std::cell::RefCell;
use std::rc::{Rc, Weak};

#[derive(Debug)]
struct Node {
    value: i32,
    parent: RefCell<Weak<Node>>,
    children: RefCell<Vec<Rc<Node>>>,
}

fn main() {
    let leaf = Rc::new(Node {
        value: 3,
        parent: RefCell::new(Weak::new()),
        children: RefCell::new(vec![]),
    });

    println!("leaf 的父節點 {:?}", leaf.parent.borrow().upgrade());

    let branch = Rc::new(Node {
        value: 5,
        parent: RefCell::new(Weak::new()),
        children: RefCell::new(vec![Rc::clone(&leaf)]),
    });

    *leaf.parent.borrow_mut() = Rc::downgrade(&branch);

    println!("leaf 的父節點 {:?}", leaf.parent.borrow().upgrade());
}

節點能夠參考其父節點但不會擁有它。在範例 15-28 中我們更新了 main 來使用新的定義，讓 leaf 節點有辦法參考它的父節點 branch：

檔案名稱：src/main.rs

use std::cell::RefCell;
use std::rc::{Rc, Weak};

#[derive(Debug)]
struct Node {
    value: i32,
    parent: RefCell<Weak<Node>>,
    children: RefCell<Vec<Rc<Node>>>,
}

fn main() {
    let leaf = Rc::new(Node {
        value: 3,
        parent: RefCell::new(Weak::new()),
        children: RefCell::new(vec![]),
    });

    println!("leaf 的父節點 {:?}", leaf.parent.borrow().upgrade());

    let branch = Rc::new(Node {
        value: 5,
        parent: RefCell::new(Weak::new()),
        children: RefCell::new(vec![Rc::clone(&leaf)]),
    });

    *leaf.parent.borrow_mut() = Rc::downgrade(&branch);

    println!("leaf 的父節點 {:?}", leaf.parent.borrow().upgrade());
}

範例 15-28：leaf 節點有其父節點 branch 的弱參考

建立 leaf 節點與範例 15-27 類似，只是要多加個 parent 欄位：leaf 一開始沒有任何父節點，所以我們建立一個空的 Weak<Node> 參考實例。

此時當我們透過 upgrade 方法嘗試取得 leaf 的父節點參考的話，我們會取得 None 數值。我們能在輸出結果的第一個 println! 陳述式看到：

leaf 的父節點 None

當我們建立 branch 節點，它的 parent 欄位也會有個新的 Weak<Node> 參考，因為 branch 沒有父節點。我們仍然有 leaf 作為 branch 其中一個子節點。一旦我們有了 branch 的 Node 實例，我們可以修改 leaf 使其擁有父節點的 Weak<Node> 參考。我們對 leaf 中 parent 欄位的 RefCell<Weak<Node>> 使用 borrow_mut 方法，然後我們使用 Rc::downgrade 函式來從 branch 的 Rc<Node> 建立一個 branch 的 Weak<Node> 參考。

當我們再次印出 leaf 的父節點，這次我們就會取得 Some 變體其內就是 branch，現在 leaf 可以取得它的父節點了！當我們印出 leaf，我們也能避免產生像範例 15-26 那樣最終導致堆疊溢位（stack overflow）的循環，Weak<Node> 會印成 (Weak)：

leaf 的父節點 Some(Node { value: 5, parent: RefCell { value: (Weak) },
children: RefCell { value: [Node { value: 3, parent: RefCell { value: (Weak) },
children: RefCell { value: [] } }] } })

沒有無限的輸出代表此程式碼沒有產生參考循環。我們也能透過呼叫 Rc::strong_count 與 Rc::weak_count 的數值看出。

視覺化 `strong_count` 與 `weak_count` 的變化

讓我們看看 Rc<Node> 實例中 strong_count 與 weak_count 的數值如何變化，我們建立一個新的內部作用域，並將 branch 的產生移入作用域中。這樣我們就能看到 branch 建立與離開作用域而釋放時發生了什麼事。如範例 15-29 所示：

檔案名稱：src/main.rs

use std::cell::RefCell;
use std::rc::{Rc, Weak};

#[derive(Debug)]
struct Node {
    value: i32,
    parent: RefCell<Weak<Node>>,
    children: RefCell<Vec<Rc<Node>>>,
}

fn main() {
    let leaf = Rc::new(Node {
        value: 3,
        parent: RefCell::new(Weak::new()),
        children: RefCell::new(vec![]),
    });

    println!(
        "leaf 的強參考 = {}、弱參考 = {}",
        Rc::strong_count(&leaf),
        Rc::weak_count(&leaf),
    );

    {
        let branch = Rc::new(Node {
            value: 5,
            parent: RefCell::new(Weak::new()),
            children: RefCell::new(vec![Rc::clone(&leaf)]),
        });

        *leaf.parent.borrow_mut() = Rc::downgrade(&branch);

        println!(
            "branch 的強參考 = {}、弱參考 = {}",
            Rc::strong_count(&branch),
            Rc::weak_count(&branch),
        );

        println!(
            "leaf 的強參考 = {}、弱參考 = {}",
            Rc::strong_count(&leaf),
            Rc::weak_count(&leaf),
        );
    }

    println!("leaf 的父節點 {:?}", leaf.parent.borrow().upgrade());
    println!(
        "leaf 的強參考 = {}、弱參考 = {}",
        Rc::strong_count(&leaf),
        Rc::weak_count(&leaf),
    );
}

範例 15-29：在內部作用域建立 branch 並觀察強與弱參考計數

在 leaf 建立後，它的 Rc<Node> 有強計數為 1 與弱計數為 0。在內部作用域中，我們建立了 branch 並與 leaf 做連結，此時當我們印出計數時，branch 的 Rc<Node> 會有強計數為 1 與弱計數為 1（因為 leaf.parent 透過 Weak<Node> 指向 branch）。當我們印出 leaf 的計數時，我們會看到它會有強計數為 2，因為 branch 現在有個 leaf 的 Rc<Node> 克隆儲存在 branch.children，但弱計數仍為 0。

當內部作用域結束時，branch 會離開作用域且 Rc<Node> 的強計數會歸零，所以它的 Node 就會被釋放。leaf.parent 的弱計數 1 與 Node 是否被釋放無關，所以我們沒有產生任何記憶體泄漏！

如果我們嘗試在作用域結束後取得 leaf 的父節點，我們會再次獲得 None。在程式的最後，leaf 的 Rc<Node> 強計數為 1 且弱計數為 0，因為變數 leaf 現在是 Rc<Node> 唯一的參考。

所有管理計數與數值釋放都已經實作在 Rc<T> 與 Weak<T>，它們都有 Drop 特徵的實作。在 Node 的定義中指定子節點對父節點的關係應為 Weak<T> 參考，讓你能夠將父節點與子節點彼此關聯，且不必擔心產生參考循環與記憶體泄漏。

總結

本章節涵蓋了如何使用智慧指標來得到一些不同於 Rust 預設參考所帶來的保障以及取捨。Box<T> 型別有已知大小並能將資料配置到堆積上。Rc<T> 型別會追蹤堆積上資料的參考數量，讓該資料能有數個擁有者。RefCell<T> 型別具有內部可變性，提供一個外部不可變的型別，但有方法可以改變內部數值，它會在執行時強制檢測借用規則，而非編譯時。

我們也討論了 Deref 與 Drop 特徵，這些對智慧指標提供了許多功能。我們探討了參考循環可能會導致記憶體泄漏以及如何使用 Weak<T> 避免它們。

如果本章節引起你的興趣，讓你想要實作你自己的智慧指標的話，歡迎查閱「The Rustonomicon」來學習更多實用資訊。

接下來，我們將討論 Rust 的並行性。你還會再學到一些新的智慧指標。

Rust 程式設計語言