我選擇寫 Rust ,因為我知道我自己並不聰明
一年前,我 commit 了我的第一行 Rust code ,截至 2023/5/20 , Rust Code 佔了我自己寫的程式的 73.28 %(現在應該佔比更高)
把 Fork 來的專案跟標籤語言們拿掉之後......天啊我都不知道我寫了這麼多 Rust pic.twitter.com/Sokp0rPlTv
— Ming Chang (@mingchang137) May 20, 2023
現在的我已經可以很自豪的說我可以用 Rust 寫幾乎所有程式。
這篇文章我會分享自己寫程式的經驗,以及為什麼我選擇了 Rust ,可以給別人在選擇該不該學習某種語言時,一點不同於他人的觀點。
聲明:這篇文章只是「分享」而非「推坑文」
偏好這種東西因人而異,像 DHH 就喜歡沒 Type 的語言, ThePrimeagen 覺得沒 Type 很糟糕(我也是這派的)
我尊重所有人的選擇,各位也不要強迫別人去學習某種語言或某種開發習慣喔~
我曾接觸過的語言
除了 Python 之外,我並沒有受過任何正式的程式語言教育,我現在常寫的語言都是我自學的,其中有真的用在工作上的語言有 Java, JS / TS 和 Rust
這邊我要稍微說下,我不清楚現在的台灣教育有沒有改變,但在我從國小開始上資訊課到高中畢業的這幾年,我從來沒有在學校學習過任何程式語言!
大一時總算有碰到一點點……App Inventor
我絕對不是說每個人都要學習程式語言,但至少在我的成長過程中,文組生(對我是文組仔)如果想要學習程式語言,是非常困難的
當年要不是我和我爸媽主動要求,要不然連 Python 都碰不到,希望現在已經有所改變
先來說說 Java 吧
Java
它算是我第一個正式用於養活自己的語言,在我寫 Java 的兩年間,我成功的將一堆比我還老、沒人維護的依賴更換成有人維護的依賴、將 Java 8 換到 Java 11 再換到 Java 17 、將 Spring 換成 Spring Boot ,這一切都是我利用我的個人時間看技術文章、看書、看演講和自己測試出來的。學習使用 Java 的同時,我感受到了這個語言的特性: Java 對於「物件」與「型別」的執著達到了我從未體會過的強度,帶來的是我就算不開 IDE ,純看程式也能了解我正在處理什麼型別的物件,就業務邏輯本身的解釋力而言,我個人覺得非常優秀。
看文件的習慣也是從 Java 學到的,大一點的框架與依賴都會提供 JavaDoc ,我經由閱讀文件學習到別人是如何設計 Library 的,也期許自己在寫程式時也要留下足夠的文件,讓他人可以更容易的了解程式的邏輯與實現。
但 Java 也有令人討厭的地方
一、惡名昭彰的 NullPointerException
Java 的 null
可以出現在任何非 primitive value 上, 包含為了解決這問題的 Optional<T>
! 這絕對是所有 Java 工程師的噩夢,我曾為了一支 API 瘋狂 NullPointerException
熬夜看了一整晚的程式碼,最後索性在每個有可能 null
的物件都換上 Optional<T>
,但這問題還是沒有解決,因為其中一個 Optional<T>
隔天就 NPE 了……
二、程式語言的「贅字」實在是太多了
嘿 Java 工程師們,你們的 main()
怎麼寫啊?
蛤什麼?你說你都直接用 Code Snippet ?那如果突然要你在只有 JDK 的環境下用記事本寫個小程式呢?
不要覺得這事不會出現,因為我就遇過,體驗十分糟糕((
三、使用者年齡老化嚴重,語言更新無法帶動使用者更新
其實我覺得這點不能完全怪在 Java 身上,畢竟老語言了。但問題是很多前輩很固執啊
Java 8 推出已經是 2014 的事情了,當時我還在讀國中,猜猜看 2022 年,我前僱主跟當時大三的我說新專案要用哪版的 JDK 開?
「Java 8 !」
不是說舊版 JDK 不能用,但一堆新語言特性沒辦法用,到後期我甚至得專門去找 for JDK 8 的依賴才能實現某些功能,反而無意義的增加了開發的困擾。
JavaScript / TypeScript
我的第一份工作與現在的工作都有用到 JavaScript 跟 TypeScript ,這兩個語言(或者說一個語言跟一個語言補強工具? Linter ?)在前端幾乎就是獨佔市場,不用也不行
我知道啦,現在可以寫 WebAssembly
,你現在看到的 Blog 就是我用 WebAssembly 寫出來的(更新:現在不是了, HTMX 超香)。但現在 WebAssembly 還是會需要 JS Glue Code 啊,沒辦法 100% 擺脫 JS 的魔掌
弱型別 + 動態型別的語言在需要快速迭代的場景非常適合,不需要花時間去處理型別問題(哈哈這是個謊言)可以把更多的時間用於思考實際的程式邏輯,但我坦白說,我對這兩種語言的好感甚至低於 Java
主要有以下幾點
一、語法與行為繁雜混亂
-
方法用到的變數會被 deep copy 還是 shallow copy 行為不明顯,每天都在貓抓老鼠跟 trial and error:
寫這篇文章前我花了四天改了一個 JS 後端,只因為 32 行的某個變數突然失去了它的 field ,最後在不同的 method 發現有一行 code shallow copy 了原本的物件,改動到了原本的值。好笑的是,出錯的地方還不是我自己查到的,我拿去跟我部門三個 JS 工程師一起查才查出來。 -
const
/let
/var
跟即將到來的using
:真的是太多了,增加學習難度之外,這邊我還要特別點名const
,它並不等價於其他語言的const
跟 Rust 不加mut
的let
,它只確保變數不會被重新宣告或重新指定,並不確保裡面的 field 也不會被重新宣告或重新指定,遇到這坑的次數已經多到數不清了 -
非同步操作有 Callback 、
Promise
跟async await
三種用法:
這個在使用 Library 時尤其噁心,為了在使用sqlite3
時也能統一使用Promise
,整個套件被我重新包裝過,最後更是直接用 Rust 寫了個rusty-sqlite3
,從 Library 層面就改用Promise
二、錯誤處理困難
寫這篇文章的幾天前,知名 TypeScript Wizard (雖然我不怎麼喜歡 TS ,但還是會去學習下用法的)分享了 TypeScript 拒絕 Typed Error GitHub Issue 的 TL;DR
Type-safe errors will probably never come to TypeScript because:
— Matt Pocock (@mattpocockuk) July 8, 2023
- In JS there's no culture of libraries declaring what errors they throw
- instanceof in catch clauses is fine
- Using a Rust-style Result is probably just betterhttps://t.co/JAOOKNIZLk
其中有一點我覺得很有趣:“In JS there’s no culture of libraries declaring what errors they throw”
在其他強型別語言, Error 通常都會繼承自代表錯誤或例外的 Interface / Trait ,並在文件中或型別上提供足夠的資訊供 Binary 用戶或 Library 使用者進行錯誤處理。 JavaScript 系列就沒這回事了,雖然也有 Error Object,但一堆 Library 根本就沒有定義他到底會 throw 啥東西出來,不清楚情況的人就只能繼續亂 catch 一通,想要好好做處理的人也只能 trial and error 或直接去翻 Library 的原始碼,這導致要在 JS 下寫穩定程式的難度比起其他程式語言更難。
三、 undefined
還有需要解釋嗎?所有的錯都是 Java 害的,真就萬惡之源啊
If I didn't have "Make it look like Java" as an order from management, *and* I had more time (hard to unconfound these two causal factors), then I would have preferred a Self-like "everything's an object" approach: no Boolean, Number, String wrappers. No undefined and null. Sigh.
— BrendanEich (@BrendanEich) June 14, 2020
Rust
我在一年前的差不多這個時候開始寫 Rust ,會對它感興趣,主要是因為我實在受夠以上這些 Bullshit 了,做了兩年多的維護,只覺得天天都在吃屎、天天都在重複之前的錯誤。 Rust 的官網清楚的寫道 “Performance, Reliability, Productivity” ,這深深的打動了我。
後來發現我日常使用的 M1 MacBook Air 所搭載的 Apple Silicon Linux GPU Driver 也是用 Rust 寫的,想著既然 GPU Driver 都能用這語言寫了,想必是真的有效?抱著懷疑的態度,我開始了我的第一個 Rust 專案。
當時的我在開發上遇到了一些問題:
一、開發體驗仍待加強
由於我從 Java 轉向 Rust ,當時我用的 IDE 是 IntelliJ IDEA ,Rust Plugin 很大程度的幫助了我進行程式的開發,但……實在是太慢了。而且當時的 IDEA 預設不會進行 macro 的分析,導致一堆 macro 使用起來體驗非常差
後來被 ThePrimeagen 的影片推坑 Neovim ,改用原生的 rust-analyzer 體驗就好不少了,不過有時開啓大型專案時依然會出現卡頓的問題,只能等待 Rust Team 持續優化了
二. 語法需要重新熟悉
雖然 Rust 許多語法我個人認為跟 TypeScript 很像,但許多概念依然跟其他語言有所不同,甚至因為設計理念的關係,會需要重新學習不一樣的做法
Java 常用的萬惡之源 null
,到了 Rust 是 unsafe 的存在。這個觀念讓我痛苦了很久,因為寫了兩年 Java 的我已經變成 null
的形狀了啊(大霧),當然在體會到 Option<T>
的好之後,反而讓我後來在 Java 也改用 Optional<T>
了
至於 try catch
轉向 Result<T, E>
,對於我而言反而好改,因為我在前公司根本就沒養成要做錯誤處理的習慣……,用上 Result<T, E>
後,才知道原先的做法有可能會出錯
不過學習曲線這件事,個人覺得不必太過擔心,而且學了絕對是利大於弊,因為……
Rust 的保姆級編程體驗
我們來做個小實驗,先在 JavaScript 寫個 function 做 Hello world ,然後貼到 Rust Playground ,直接按下 Build!
function main() {
console.log("Hello world!");
}
Compiling playground v0.0.1 (/playground)
error: expected one of `!` or `::`, found `main`
--> src/lib.rs:1:10
|
1 | function main() {
| -------- ^^^^ expected one of `!` or `::`
| |
| help: write `fn` instead of `function` to declare a function
error: could not compile `playground` (lib) due to previous error
我們可以看到,Rust 編譯器提供了非常有用的資訊!我們應該要使用 fn
而不是 function
去宣告一個函數。
類似於這種的有效錯誤訊息,在其他語言非常少見,比如我們在 JS 中寫 Rust 的 Hello world:
fn main() {
println!("Hello world!");
}
main() // JS 沒有 main function ,需要主動呼叫
fn main() {
^^^^
SyntaxError: Unexpected identifier 'main'
at internalCompileFunction (node:internal/vm:73:18)
at wrapSafe (node:internal/modules/cjs/loader:1177:20)
at Module._compile (node:internal/modules/cjs/loader:1221:27)
at Module._extensions..js (node:internal/modules/cjs/loader:1311:10)
at Module.load (node:internal/modules/cjs/loader:1115:32)
at Module._load (node:internal/modules/cjs/loader:962:12)
at Function.executeUserEntryPoint [as runMain] (node:internal/modules/run_main:83:12)
at node:internal/main/run_main_module:23:47
Node.js v20.3.1
看了跟沒看一樣,我還是不知道要改什麼
Rust 的編譯器跟 Clippy 提供了非常多有效的建議跟幫助,只要習慣看錯誤提示,甚至可以單靠錯誤提示進行語言的學習,這是跟其他語言不同的,比如第一次寫 Rust 一定會碰到的 borrow checker:
fn main() {
let val1 = vec![1, 2];
let _val2 = val1; // 此處加底線,是為了避免 rustc 噴出未使用變數的警告
println!("{val1:?}");
}
Compiling playground v0.0.1 (/playground)
error[E0382]: borrow of moved value: `val1`
--> src/main.rs:4:15
|
2 | let val1 = vec![1, 2];
| ---- move occurs because `val1` has type `Vec<i32>`, which does not implement the `Copy` trait
3 | let _val2 = val1;
| ---- value moved here
4 | println!("{val1:?}");
| ^^^^^^^^ value borrowed here after move
|
= note: this error originates in the macro `$crate::format_args_nl` which comes from the expansion of the macro `println` (in Nightly builds, run with -Z macro-backtrace for more info)
help: consider cloning the value if the performance cost is acceptable
|
3 | let _val2 = val1.clone();
| ++++++++
For more information about this error, try `rustc --explain E0382`.
error: could not compile `playground` (bin "playground") due to previous error
喔~原來物件已經被移動到 val2
了,而且編譯器推薦我如果性能影響可接受,可以考慮使用 clone()
但這又是怎麼運作的呢,在 JavaScript 明明是可以用的啊:
const val1 = [1, 2];
const val2 = val1;
console.log(val1);
$ node index.js
[ 1, 2 ]
讓我們執行看看編譯器提示的 rustc --explain E0382
Since MyStruct is a type that is not marked Copy, the data gets moved out of x when we set y. This is fundamental to Rust’s ownership system: outside of workarounds like Rc, a value cannot be owned by more than one variable.
Sometimes we don’t need to move the value. Using a reference, we can let another function borrow the value without changing its ownership. In the example below, we don’t actually have to move our string to calculate_length, we can give it a reference to it with & instead.
這邊附上網頁版連結,其實在 Playground 裡也可以直接點錯誤代碼看到同一個頁面喔!
原來在 Rust 的所有權機制中,除了被標記為 Copy 的型別跟 Rc 等例外,物件的資料會被移動到另一個物件啊!諸如此類清楚明瞭的說明在我學習 Rust 的時候,給了我非常大的幫助。
另外,這個編譯器還能避免開發者出錯,比如上面的 JS 例子,稍微修改下就會開始崩壞了:
const val1 = [1, 2];
const val2 = val1;
/* 假設這邊有 50 行塞在中間 */
val2.pop();
/* 再假設這邊有 70 行塞在中間 */
console.log(val1);
$ node index.js
[ 1 ]
「奇怪了,我的值到底為什麼被改了??」為了讓程式正常工作,身為工程師的我就只能開始逐行檢查。這段過程所需花費的時間與難度,會根據邏輯的複雜性提高,與對於程式原始碼的熟悉度隨著時間下降,而逐漸增加。
如果換成 Rust 呢?
fn main() {
let val1 = vec![1, 2];
let val2 = val1;
/* 假設這邊有 50 行塞在中間 */
val2.pop();
/* 再假設這邊有 70 行塞在中間 */
println!("{val1:?}");
}
除了上面提過的 borrow checker 錯誤提示外,你還會收到這個東西:
Compiling playground v0.0.1 (/playground)
error[E0596]: cannot borrow `val2` as mutable, as it is not declared as mutable
--> src/main.rs:7:5
|
7 | val2.pop();
| ^^^^^^^^^^ cannot borrow as mutable
|
help: consider changing this to be mutable
|
3 | let mut val2 = val1;
| +++
編譯器提示,需要我們將變數宣告為可變的變數,才能使用 pop()
,可變不可變,清楚明瞭,也不會突然就被改了導致需要重新 Review 自己的程式碼,因為編譯器提供的保證,除非你主動退出(unsafe),否則一定有效,只要遵守編譯器的規則,就能在編譯前避免很多的問題
如果想要做到和 JavaScript 相同的行為,我們需要這樣寫才行:
fn main() {
let mut val1 = vec![1, 2];
let val2 = &mut val1;
/* 假設這邊有 50 行塞在中間 */
val2.pop();
/* 再假設這邊有 70 行塞在中間 */
println!("{val1:?}");
}
Compiling playground v0.0.1 (/playground)
Finished dev [unoptimized + debuginfo] target(s) in 0.60s
Running `target/debug/playground`
[1]
val2
需要被宣告為 val1
的可變引用(mutable reference),並且 val1
也必須利用 mut
宣告為可變才能這麼做。開發者會理解自己所操作的是什麼樣的物件,而維護者維護時所需花費的腦力與時間,也能隨著這些就在程式碼上的 keyword 而大幅降低
學習 Rust 甚至能學到一些新知識,比如由於 Rust 不像 JavaScript 幾乎所有使用場景都是單線程(沒人愛用 Workers 吧???),所以還會有很多特殊的規則是使用 JS 這種主要為單線程的語言所學不到的,比如下面這個例子:
const globalVal = [];
async function receiveFromExternalSource() {
const dataList = await externalSource();
dataList.forEach((data) => globalVal.push(data));
}
receiveFromExternalSource().then(() => console.log(globalVal));
這在 JavaScript 是完全合法的,你可能也不會發現任何問題。
但如果我們將程式換到 Rust 呢?
use tokio;
static mut GLOBAL_VAL: Vec<String> = vec![];
#[tokio::main]
async fn main() {
receive_data_from_external_source().await;
}
async fn receive_data_from_external_source() {
let data_list = external_source().await;
data_list.into_iter().for_each(|data| GLOBAL_VAL.push(data));
}
Compiling playground v0.0.1 (/playground)
error[E0133]: use of mutable static is unsafe and requires unsafe function or block
--> src/main.rs:12:43
|
12 | data_list.into_iter().for_each(|data| GLOBAL_VAL.push(data));
| ^^^^^^^^^^^^^^^^^^^^^ use of mutable static
|
= note: mutable statics can be mutated by multiple threads: aliasing violations or data races will cause undefined behavior
For more information about this error, try `rustc --explain E0133`.
error: could not compile `playground` (bin "playground") due to previous error
當時看到這個錯誤後,我才恍然大悟,原來做可變的 global variable 竟有可能造成預期外的行為(undefined behavior)!
題外話,遇到這種問題,有兩種解法:
第一種:利用「內部可變」物件將值包起來,就可以正常利用了,比如Mutex
互斥鎖、RwLock
讀寫鎖跟 Atomicuse tokio; use std::sync::Mutex; static GLOBAL_VAL: Mutex<Vec<String>> = Mutex::new(vec![]); #[tokio::main] async fn main() { receive_data_from_external_source().await; } async fn receive_data_from_external_source() { let data_list = external_source().await; let mut locked_global_val = GLOBAL_VAL.lock().unwrap(); data_list.into_iter().for_each(|data| locked_global_val.push(data)); }
第二種:使用 unsafe ,這種做法相當於跟編譯器說「放心吧我知道這邊可能會有問題,交給我自己處理」
use tokio; static mut GLOBAL_VAL: Vec<String> = vec![]; #[tokio::main] async fn main() { unsafe { receive_data_from_external_source().await; } } async unsafe fn receive_data_from_external_source() { let data_list = external_source().await; data_list.into_iter().for_each(|data| GLOBAL_VAL.push(data)); }
以上這些只是 Rust 編譯器功能的一小部分,礙於篇幅,這邊基本不可能完整展示全部的功能。所以這邊提供 Rust error codes index 和 Clippy Lints 的連結,感興趣的話可以點進去查看上千個 rustc 和 cargo clippy 規則
我將 Rust 編譯器視為我的好友,在我練習時提供提示幫助我學習,在我開發 Rust 程式時監督我寫出安全的程式,並在我犯錯時提醒我處理,使我受益良多,這是我在其他語言都未曾見過的。
就這點,我甚至認為 Rust 的學習曲線並沒有高出其他語言多少。
接受自己並不如想像的如此聰明,至少,沒有電腦聰明
我很常看到或聽到以下言論:
- 如果程式寫的好,用什麼語言寫都能很快很安全
- 只要我自己記得,這邊的邏輯可以用 某種 Workaround 寫,反正之後再做檢查就好
我曾一度接受這種說法,甚至自己發表過這種言論,但現在我卻認為這些說法都是極其不負責任的。因為人類會犯錯,人無法確保自己永遠都是正確的。
程式則不一樣,只要在正常的硬體中執行正確的邏輯,它們運行的效率與精準度絕對比人類還高。我認識到了這點,也最終接受了這個事實。
因為在寫程式的這幾年,我一直都在不斷付出名為「除錯」的代價,這邊「除錯」的對象往往不是需要人工處理的業務邏輯錯誤,而是「空指針引用」、「使用未初始化的物件」與「錯誤的改變不應改變的值」等低級錯誤,這些錯誤完全都可以透過良好的語言設計,與智能的編譯器,在編譯時就抓出問題!
從 rustc 、 cargo clippy 到 Miri , Rust 生態的各種輔助工具不僅僅只是將程式編譯出來執行,它們協助我不犯下愚蠢的錯誤,幫助我產出更優秀穩定的程式,並可以把寶貴的時間,完全用在業務邏輯的除錯與優化。
在本文第一章提到的各種其他語言的問題,在 Rust 的實現中可以發現許多改進的嘗試:
- 預設所有變數都必須進行初始化,避免使用到未初始化的物件
std::mem::MaybeUninit
是例外,通常只有在要使用 FFI 的時候才會使用,且取用它是 unsafe 的 - 利用
Option<T>
enum 作為可能為空的物件表示,且開發者必須進行 pattern matching 才能取用裡面的值,有效避免NullPointerException
std::ptr::null
可以建立 null raw pointer ,不過在 Rust 中 A null pointer is never valid, not even for accesses of size zero. - 利用
Result<T, E>
進行錯誤處理,且因為 Rust 的強型別特性,使所有錯誤均會被提示進行處理,再也不需要通靈或 trial and error 了 - 語法減少許多冗文贅字
這就是我為何選擇使用 Rust ,而我也會繼續使用它:只需付出比其他程式語言稍長的開發時間,便能揚長避短,何樂而不為呢?