このハンズオンについて
- Rust とは?から始まって、基本的な文法をカバーします
- 自分なりの grep コマンドを実装します
- 自分のペースで、できるところまでやりましょう
今回の成果物:grep
- テキストファイルから、パターンに一致する行を抜き出すコマンド
- 使い方:grep オプション パターン ファイル名
- 次の例では、Cargo.tomlの中から、2018という文字列が含まれる行を抜き出しています:
% grep 2018 Cargo.toml
edition = "2018"
資料の使い方
- 資料はスライド形式になっています
- 横方向に進んでいけば、自分なりの grep を実装できます
- 縦方向にも進める場合もあります
縦方向のスライドは補足です
- 縦方向のスライドには、補足や詳細な情報がのっています
本日の内容
- Rust についての簡単な紹介
- FizzBuzz を作ろう
- テキストファイルを表示するプログラムを作ろう
- 2 を改造して、grep コマンドを作ろう
Rust とは
- システムプログラミング用の言語としてスタートしました
- 信頼性が高く、性能の良いプログラムを書けるように設計されています
- 組み込みからWeb まで、さまざまな場面で利用されています
Rust Search Extenstion
- Rust のドキュメント検索が楽になるブラウザ拡張
- rs キーワードと URL バーに入力すると、適切な文書を表示します
- Web サイト
FizzBuzz を作ろう
- 1 から 100 までの数値を出力します
- ただし、次の場合は数字の代わりに指定された文字列を出力します
- 数字が 3 の倍数の場合、Fizz を出力します
- 数字が 5 の倍数の場合、Buzz を出力します
- 数字が 3 の倍数で、5 の倍数でもある場合には、FizzBuzz を出力します
 
プロジェクトの作成
- Rust のプロジェクトの操作には、cargo コマンドを使います
- cargo newを実行すると、プロジェクトが作成されます
% cargo new fizzbuzz
     Created binary (application) `fizzbuzz` package
プロジェクトのフォルダ構成
fizzbuzz
├── Cargo.toml
└── src
   └── main.rs
プロジェクトのビルドと実行
- cargo buildでビルドします
- cargo runで、ビルドしたプログラムを実行します- 
- ビルドされていない場合は、ビルドも行います
- 標準ではデバッグビルドを実行します
 
% cd fizzbuzz
% cargo run
   Compiling fizzbuzz v0.1.0 (/Users/chikoski/fizzbuzz)
    Finished dev [unoptimized + debuginfo] target(s) in 0.77s
     Running `target/debug/fizzbuzz`
Hello, world!
main.rs
- main 関数が定義されています
- この関数(main)がエントリーポイントです
- println! は文字列を出力し、最後に改行するマクロです
fn main() {
    println!("Hello, world!");
}
繰り返し:while 文
fn main() {
  let mut counter = 0;
  while counter < 10{
    println!("Hello, world!");
    counter += 1;
  }
}
イテレーターを使った書き換え
- 0..10は 0 以上 10 未満の範囲を表すオブジェクトを定義します
- このオブジェクトは、イテレーターとしての性質を持っています
- そのため for 文で範囲に含まれる整数を列挙できます
- 下記では、列挙された値を使わないので、変数名に _を利用しています
fn main() {
  for _ in 0..10{
    println!("Hello, world!");
  }
}
列挙された値を利用する場合
- forの後に記述された変数で、列挙された値を参照できます
- 次の例では、列挙された値を埋め込んだ文字列を出力しています
- Playground で試す
fn main() {
  for iteration in 0..10{
    println!("Hello, world! (iteration #{})", iteration);
  }
}
条件分岐:if 式
- Rust での if は式です。つまり評価値を持ちます
- 実行したブロックで最後に評価した式の値が、if 式の評価値となります
- ブロックの最後の式に ;がついていないことがポイントです
fn main() {
  for n in 0..10{
    let output = if n % 15 == 0{
      "FizzBuzz"
    }else{
      format!("{}", n)
    };
    println!("{}", output);
  }
}
format
- formatは書式つき文字列を処理するマクロです
- 第 1 引数に指定した書式に、第 2 引数以降の値を埋め込みます
- 第 1 引数にある {}は値を埋め込むプレースホルダーを意味します
- 次の例では、Hello, {}の{}部分に、nameの値が埋め込まれます
fn main(){
  let name = "World";
  let output = format!("Hello, {}!", name);
  println!("{}", output);
}
マクロの利用
- マクロを利用する時は、名前の後に !をつけます
- 下記の例にある formatやprintlnはマクロです
- なお !をつけない場合、関数呼び出しとして解釈されます
fn main(){
  let name = "World";
  let output = format!("Hello, {}!", name);
  println!("{}", output);
}
コンパイル時の型チェック
- コンパイル時には型チェックが行われます
- 次の例では、if 節の評価値が str型なのに対し、else の評価値がString型であることが原因でコンパイルエラーとなっています
- "FizzBuzz"に対して、- to_stringメソッドを呼ぶように変更することで修正できます
error[E0308]: `if` and `else` have incompatible types
 --> src/main.rs:6:9
  |
3 |         let output = if n % 15 == 0{
  |  ____________________-
4 | |         "FizzBuzz"
  | |         ---------- expected because of this
5 | |       }else{
6 | |         format!("{}", n)
  | |         ^^^^^^^^^^^^^^^^ expected `&str`, found struct `String`
7 | |       };
  | |_______- `if` and `else` have incompatible types
  |
String と str
- Stringは文字列を表すオブジェクトです
- strは文字列のスライスを表す値です
- to_stringメソッドで、- Stringオブジェクトへ変換できます
let name = "World";
let message = format!("Hello, {}!", name);
println!("{}", message);
   
let slice_of_message = &message[0..5];
println!("{}", slice_of_message);
let another_string = slice_of_message.to_string();
println!("{}", another_string);
スライス から String への変換(つづき)
- formatマクロを使って変換する場合も多く見られます
- スライスである文字列リテラルを変換する場合にも多用されます
let a_str = "Hello, world!";
let converted_string = format!("{}", a_str);
let a_string = format!("Hello, world!");
より詳しくコンパイルエラーについて知りたい場合は
- rustc に --explain オプションをつけて実行すると、より詳しい解説を読めます
z* 次の例では、E0308 のエラーについて、解説を読みます
- 同じ解説を Web でも読めます
% rustc --explain E0308
Expected type did not match the received type.
Erroneous code examples:
コンパイルエラーの修正方法
- if 節の評価値の型が Stringとなるように修正します
- スライスを String型に変換することで、if 節のエラーが修正できます
fn main() {
  for n in 0..10{
    let output = if n % 15 == 0{
      format!("FizzBuzz")
    }else{
      format!("{}", n)
    };
    println!("{}", output);
  }
}
さらに別のコンパイルエラーの修正方法
- String::fromで- Stringオブジェクトを作ることもできます
fn main() {
  for n in 0..10{
    let output = if n % 15 == 0{
      String::from("FizzBuzz")
    }else{
      format!("{}", n)
    };
    println!("{}", output);
  }
}
FizzBuzz: 手続き的なバージョン
- 以下は、手続き的に書いた FizzBuzz の例です
- これを少しずつ改変し、Rust の柔軟性をみていきます
fn main() {
  for n in 1..20{
    let output = if n % 15 == 0{
      format!("FizzBuzz")
    }else if n % 5 == 0{
      format!("Buzz")
    }else if n % 3 == 0{
      format!("Fizz")
    }else{
      format!("{}", n)
    };
    println!("{}", output);
  }
}
関数への切り出し
- fnキーワード で関数を定義できます
- ()内に引数のリストを、- ->の後に返り値の型を書きます
- 下記は、FizzBuzz の数値から文字列への変換を、関数に切り出した例です
- u32を String への変換として実装しています
fn fizzbuzz(n: u32) -> String{
  if n % 15 == 0{
    format!("FizzBuzz")
  }else if n % 5 == 0{
    format!("Buzz")
  }else if n % 3 == 0{
    format!("Fizz")
  }else{
    format!("{}", n)
  }
}
関数呼び出し
- 実引き数をを与えて関数を呼びます
- 下記の例では、outputやnに型が明記されていません
- これはコンパイラーが型推論を行うためです
fn main() {
  for n in 1..20{
    let output = fizzbuzz(n);
    println!("{}", output);
  }
}
変換部分を関数に切り出した結果
fn fizzbuzz(n: u32) -> String{
  if n % 15 == 0{
    format!("FizzBuzz")
  }else if n % 5 == 0{
    format!("Buzz")
  }else if n % 3 == 0{
    format!("Fizz")
  }else{
    format!("{}", n)
  }
}
fn main() {
  for n in 1..20{
    let output = fizzbuzz(n);
    println!("{}", output);
  }
}
FizzBuzz:関数プログラミング的なアプローチ
- FizzBuzz はデータ変換を行う関数として捉えることもできます
- 例:数値の範囲 -> 文字列
- 一つ一つの数値を、文字列に変換する関数は fizzbuzzとして用意されています
- これを使って、関数プログラミング的なアプローチで FizzBuzz を書き直します
FizzBuzz: map メソッド
- コレクション中の要素一つ一つに関数を適用して、別のコレクションを作る map と呼ばれる操作は、関数プログラミングで良く利用されます
- Rust のイテレーターにも mapメソッドは用意されています
- このメソッドは、各要素に、引数に与えた関数を適用した結果を持つイテレーターを返します
fn main() {
  for output in (1..20).map(fizzbuzz){
    println!("{}", output);
 }
}
クロージャー:関数の一種
- クロージャーは関数の一種で、定義された時にアクセス可能な変数であれば関数本体内で利用できる、という点が特徴です
- 無名関数やラムダ、といった名前でクロージャーを提供している言語もあります
- Rust でもクロージャーは利用できます。下記の例では、 foldメソッドの第 2 引数でクロージャーを定義しています
- 仮引数リストは |と|の間に記述します
fn main() {
  let output = (1..20).map(fizzbuzz)
      .fold(format!(""), |accum, line|{
    format!("{}\n{}", accum, line)
  });
  println!("{}", output);
}
関数プログラミング的な FizzBuzz
fn fizzbuzz(n: u32) -> String{
  if n % 15 == 0{
    format!("FizzBuzz")
  }else if n % 5 == 0{
    format!("Buzz")
  }else if n % 3 == 0{
    format!("Fizz")
  }else{
    format!("{}", n)
  }
}
fn main() {
  let output = (1..20).map(fizzbuzz).fold(format!(""), |accum, line|{
    format!("{}\n{}", accum, line)
  });
  println!("{}", output);
}
単体テスト
- #[test]とアノテーションされた関数は、テスト用の関数として処理されます
- 次の例は、fizzbuzzの振る舞いをテストする関数です
- cargo testでテストを実行できます
#[test]
fn test_fizzbuzz_returns_fizzbuzz() {
    let expected = format!("FizzBuzz");
    let actual = fizzbuzz(15);
    assert_eq!(expected, actual);
}
アサーション
- アサーションが満たされるかどうかで、テストの成否がきまります
- アサーションは assert、assert_eq、assert_neマクロで記述します
- 次の例では、fizzbuzzの返り値に関する期待をassert_eqで記述しています
#[test]
fn test_fizzbuzz_returns_fizzbuzz() {
    let expected = format!("FizzBuzz");
    let actual = fizzbuzz(15);
    assert_eq!(expected, actual);
}
テストの実行と、その結果
- cargo testでテストが実行されます
- 定義されたテストを全て実行し、結果を次のように表示します
- 次の例では、4 つのテストが全て成功していることがわかります
% cargo test
(中略)
running 4 tests
test test_fizzbuzz_returns_buzz ... ok
test test_fizzbuzz_returns_fizz ... ok
test test_fizzbuzz_returns_fizzbuzz ... ok
test test_fizzbuzz_returns_number_string ... ok
test result: ok. 4 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; finished in 0.00s
テストコードの例
#[test]
fn test_fizzbuzz_returns_fizzbuzz() {
  let expected = format!("FizzBuzz");
  let actual = fizzbuzz(15);
  assert_eq!(expected, actual);
}
#[test]
fn test_fizzbuzz_returns_fizz() {
  let expected = format!("Fizz");
  let actual = fizzbuzz(6);
  assert_eq!(expected, actual);
}
#[test]
fn test_fizzbuzz_returns_buzz() {
  let expected = format!("Buzz");
  let actual = fizzbuzz(10);
  assert_eq!(expected, actual);
}
#[test]
fn test_fizzbuzz_returns_number_string() {
  let number = 4;
  let expected = format!("{}", number);
  let actual = fizzbuzz(number);
  assert_eq!(expected, actual);
}
FizzBuzz のまとめ
- 基本的な文法を確認しました
- 手続き的にも、関数型的にも書けます
- コンパイラーを良いレビュワーとして付き合っていけると良いと思います
テキストファイルを出力するプログラムを作ろう
- 新しいプロジェクトを作ります
- 決まったファイルの中身を出力するプログラムを作ります
- コマンドライン引数で、読むファイルを指定できるように変更します
プロジェクトの作成
- mygrepという名前のプロジェクトを作ります
- 次の例では、ホームディレクトリにプロジェクトを作成しています
% cd
% cargo new mygrep
自分自身を出力するプログラム
fn main() {
  let path = "./src/main.rs";
  
  match std::fs::read_to_string(path) {
    Ok(content) => print!("{}", content),
    Err(reason) => println!("{}", reason)
  }
}
ファイル読み込みには失敗がつきもの
- Rust では、ある操作の成否を Resultを使って表現します
- Resultは- Okもしくは- Errを値に持つ列挙型です
- Okか- Errかは、- is_okメソッドで判別できます
fn main() {
  let result: Result<u32, String> = Ok(1);
  let message = if result.is_ok(){
    "Success"
  }else{
    "Fail"
  };
  println!("{}", message);
}
Result<T, E>
- Resultは- Okと- Errを値に持つ列挙型です
- Okは処理の成果物を、- Errはエラー値を内部に持っています
- 成果物 / エラー値の型は自由に変えられるようになっています
enum Result<T, E> {
   Ok(T),
   Err(E),
}
成果物 / エラーの型の指定
- 成果物やエラーの表現は、プログラムによって異なります
- そのため成果物のデータ型とエラーを表すデータ型もあわせて指定します
- 次の例では、成果物は u32であり、エラーはStringで表現されます
let result: Result<u32, String> = Ok(1);
成果物の取り出し方(unwrap を使う場合)
- unwrapメソッドを使って、成果物(もしくはエラーの理由)を取り出せます
- 次の例では、成功した場合に unwrapメソッドを使って成果物を取り出しています
fn main() {
  let result: Result<u32, String> = Ok(1);
  let message = if result.is_ok(){
    format!("Result = {}", result.unwrap())
  }else{
    format!("Fail")
  };
  println!("{}", message);
}
成果物の取り出し方(パターンマッチを使う場合)
- 条件分岐と unwrapとの組み合わは、パターンマッチを使って簡略化できます
- パターンマッチは match 式 として記述できます
- パターンの一部分を、変数に束縛することで、Ok/Errから値を取り出せます
fn main() {
  let result: Result<u32, String> = Ok(1);
  let message = match result {
    Ok(value) => format!("Result = {}", value),
    Err(_) => format!("Fail")
  };
  println!("{}", message);
}
成果物の取り出し方(if let を使う場合)
- if letという構文でも、成果物を取得できます
- ある処理が成功した場合にのみ続きを実行したい、という時によく使われます
fn main() {
  let result: Result<u32, String> = Ok(1);
  if let Ok(value) = result {
    println!("Result = {}", value);
  }
}
? 演算子を利用したアーリーリターン
- その場でエラーを返して関数から脱出することはよくあります
- ?演算子を利用することで、アーリーリターンをシンプルに記述できます
- 次の例では main関数でアーリーリターンしています(Playground で試す)
- これにあわせて main関数に返り値を設定しています
fn accept_only_even_number(value: u32) -> Result<u32, String>{
  if value % 2 == 0{
    Ok(value)
  }else{
    Err(format!("Odd number is given"))
  }
}
fn main() -> Result<(), String>{
  let value = accept_only_even_number(2)?;
  println!("Result = {}", value);
  let value = accept_only_even_number(3)?;
  println!("Result = {}", value);
  
  Ok(())
}
Result のエイリアス:std::io::Result
- エラーの理由を表す型が決まっている、といった理由で Result のエイリアスが作られることは良くあります
- 代表例は、std::io::Result です
- 次のように、エラーを std::io::Error で表すと定めています
type Result<T> = Result<T, std::io::Error>;
内容を出力する部分を関数へ切り出し
- 出力するファイルを指定できるようにするための準備として、内容を出力する部分を関数に切り出します
- ファイルのパスを Stringで受け取り、()を返す関数として定義しました
- これにあわせて pathの型がStringになっている点に注意してください
fn run(path: String){
  match std::fs::read_to_string(path) {
    Ok(content) => print!("{}", content),
    Err(reason) => println!("{}", reason)
  }  
}
fn main() {
  let path = format!("./src/main.rs");
  run(path);
}
出力するファイルの指定方法
- 出力するファイルを、コマンドライン引数として指定することとします
- 実行のイメージは次のようになります
- この例では src/main.rsを出力します
% cargo run src/main.rs
コマンドライン引数の取得
- std::env::args()は、コマンドライン引数をイテレーターを返します
- 各引数は、String型で表現されています
- nthメソッドで、n 番目の要素を取得できます
- nthメソッドは- Optionという値を返します
fn main() {
  let arguments = std::env::args();
  match arguments.nth(1){
    Some(path) => run(path),
    None => println!("No path is specified"),
  }  
}
Option: null かもしれない値の表現
- Option は存在するかもしれないし、しないかもしれないといった値を表現します
- 下記の例では、1 番目のコマンドライン引数を取得しています
- この値が存在するかどうかは、ユーザーの入力に依存します
fn main() {
  let arguments = std::env::args();
  match arguments.nth(1){
    Some(path) => run(path),
    None => println!("No path is specified"),
  }  
}
Option の値:Some と None
fn main() {
  let arguments = std::env::args();
  match arguments.nth(1){
    Some(path) => run(path),
    None => println!("No path is specified"),
  }  
}
Option からの値取得
- Some は、実際の値を内部に保持しています
- Option は Result と同様に、unwrapメソッドを持っています
- またパターンマッチや、if let、?演算子も利用できます
fn main() {
  let arguments = std::env::args();
  match arguments.nth(1){
    Some(path) => run(path),
    None => println!("No path is specified"),
  }  
}
ここまででできたプログラム
fn run(path: String){
  match std::fs::read_to_string(path) {
    Ok(content) => print!("{}", content),
    Err(reason) => println!("{}", reason)
  }  
}
fn main() {
  let arguments = std::env::args();
  match arguments.nth(1){
    Some(path) => run(path),
    None => println!("No path is specified"),
  }  
}
grep への拡張
- ここまでで、指定したファイルの中身を文字列として出力するプログラムができました
- これを拡張して grep コマンドを実装します
- grep には 2 つのコマンドライン引数があります:パターンとパスです
- 次の例では、version がパターンで、Cargo.toml がパスとなります
% grep version Cargo.toml
version = "0.1.0"
run を変更して grep を実装します
fn grep(content: String, pattern: String){
  for line in content.lines(){
    if line.contains(pattern.as_str()){
      println!("{}", line);
    }
  }
}
fn run(path: String, pattern: String){
  match std::fs::read_to_string(path) {
    Ok(content) => grep(content, pattern),
    Err(reason) => println!("{}", reason)
  }  
}
パターンとファイルパスの取得
- std::env::argsの返り値はイテレーターとしての性質を持っています
- nthメソッドを呼ぶたびに、内部の状態が変わります
- 状態変化による面倒を避けるため、都度 std::env::argsを呼んでいます
fn main() {
  let pattern = std::env::args().nth(1);
  let path = std::env::args().nth(2);
  if pattern.is_some() && path.is_some(){
    run(path.unwrap(), pattern.unwrap());
  }
}
ユーザー定義型
- 今後の発展のために、pathとpatternをまとめたデータ構造を作ります
- データ構造は structキーワードを使って定義できます
struct MyGrep{
  path: String,
  pattern: String,
}
impl:データ構造に振る舞いを与えるキーワード
- implキーワードを使うと、データ構造に振る舞いを定義できます
- 例えば、データ構造を作成する関数 new は次のように定義できます
struct MyGrep{
  path: String,
  pattern: String,
}
impl MyGrep{
  fn new(path: String, pattern: String) -> MyGrep{
    MyGrep{
      path, 
      pattern,
    }
  }
}
MyGrep 型を使った書き換え
- 定義した MyGrep 型を使うようにコードを書き換えます
- 書き換えるのは、main と run の 2 関数です
- 変数名とフィールド名を .でつなぐとフィールドの値を参照できます
fn run(mygrep: MyGrep){
  match std::fs::read_to_string(mygrep.path) {
    Ok(content) => grep(content, mygrep.pattern),
    Err(reason) => println!("{}", reason)
  }  
}
fn main(){
  let pattern = std::env::args().nth(1);
  let path = std::env::args().nth(2);
  if pattern.is_some() && path.is_some() {
    run(MyGrep::new(path.unwrap(), pattern.unwrap()))
  }
}
ここまでの状態
struct MyGrep{
  path: String,
  pattern: String,
}
impl MyGrep{
  fn new(path: String, pattern: String) -> MyGrep{
    MyGrep{
      path, 
      pattern,
    }
  }
}
fn grep(content: String, pattern: String){
  for line in content.lines(){
    if line.contains(pattern.as_str()){
      println!("{}", line);
    }
  }
}
fn run(mygrep: MyGrep){
  match std::fs::read_to_string(mygrep.path) {
    Ok(content) => grep(content, mygrep.pattern),
    Err(reason) => println!("{}", reason)
  }  
}
fn main(){
  let pattern = std::env::args().nth(1);
  let path = std::env::args().nth(2);
  if pattern.is_some() && path.is_some() {
    run(MyGrep::new(path.unwrap(), pattern.unwrap()))
  }
}
コマンドラインオプションに対応しよう
- grep は -nオプションをつけると、結果に行番号をつけて結果を出力します
- この機能を mygrep にも実装します
- オプションの解析には、ライブラリを利用することします
package と crate
- ライブラリやバイナリのことを、Rust では crate(クレート)と呼びます
- 1 つ以上の crate を取りまとめたものを package と呼びます
- package は必ず Cargo.toml を持っています
- このハンズオンでは、mygrep パッケージを操作しています
% cargo new mygrep
  Created binary (application) `mygrep` package
crates.io:crate レポジトリ
- Cargo は 3rd party ライブラリ(crate)のインストールや管理を行えます
- レポジトリに公開されている crate は、cargo コマンドでインストールできます
- crates.io が標準のレポジトリとして利用されます
crate の追加
- 今回は structopt という crate を使います
- Cargo.toml の dependencies に、使用する crate を追記することで利用できるようになります
- 次の例は、structopt の 0.3.21 を使用することを記述しています
[dependencies]
structopt = "0.3.21"
コマンドラインオプションの解析
- structopt を使うと、コマンドラインオプションの解析を宣言的に記述できます
- 定義したデータ構造の各フィールドにアトリビュートを追加することで、コマンドラインオプションとの対応関係を記述します
- 以下は、MyGrep 型にアトリビュートを追加した例です
use structopt::StructOpt;
#[derive(StructOpt)]
#[structopt(name="mygrep")]
struct MyGrep{
  #[structopt(name = "PATTERN")]
  pattern: String,
  #[structopt(name = "FILE")]
  path: String,
}
コマンドラインオプションの解析(つづき)
- MyGrep::from_argsは structopt によって追加されました
- この関数が、コマンドラインオプションの解析と、MyGrep オブジェクトを作成します
fn main(){
  let mygrep = MyGrep::from_args();
  run(mygrep);
}
ここまでの状態(Cargo.toml)
[package]
name = "mygrep"
version = "0.1.0"
authors = ["自分のなまえ"]
edition = "2018"
[dependencies]
structopt = "0.3.21"
ここまでの状態(main.rs)
- MyGrep::newは使わなくなったので、削除しました
use structopt::StructOpt;
#[derive(StructOpt)]
#[structopt(name="mygrep")]
struct MyGrep{
  #[structopt(name = "PATTERN")]
  pattern: String,
  #[structopt(name = "FILE")]
  path: String,
}
fn grep(content: String, pattern: String){
  for line in content.lines(){
    if line.contains(pattern.as_str()){
      println!("{}", line);
    }
  }
}
fn run(mygrep: MyGrep){
  match std::fs::read_to_string(mygrep.path) {
    Ok(content) => grep(content, mygrep.pattern),
    Err(reason) => println!("{}", reason)
  }  
}
fn main(){
  let mygrep = MyGrep::from_args();
  run(mygrep);
}
Trait:データ構造の満たす性質の定義
- Rust は型を、そのデータ構造が満たす性質で区別します
- データ構造の満たす性質は、インタフェースの集まりとして定義されます
- インタフェースの集まりのことを、Rust では trait と呼びます
- 次の例では、i32とVecは、ともにZeroという trait を実装しているため、同じ型として扱えます
trait Zero {
    fn is_zero(&self) -> bool;
}
impl Zero for i32 {
    fn is_zero(&self) -> bool { *self == 0 }
}
impl<T> Zero for Vec<T>{
    fn is_zero(&self) -> bool{ self.len() == 0 }
}
Derive アトリビュート:コードの自動的な追加
#[derive(PartialEq, Clone)]
struct Foo<T> {
    a: i32,
    b: T,
}
use:名前空間へのシンボルの追加
use structopt::StructOpt;
#[derive(StructOpt)]
#[structopt(name="mygrep")]
struct MyGrep{
  #[structopt(name = "PATTERN")]
  pattern: String,
  #[structopt(name = "FILE")]
  path: String,
}
-n オプションの追加
- line_numberという bool 型のフィールドを追加します
- 追加したフィールドにも、structopt アトリビュートを追加します
- shortはショートオプション、- longはロングオプションを受け付けるための記述です
struct MyGrep{
  #[structopt(name = "PATTERN")]
  pattern: String,
  #[structopt(name = "FILE")]
  path:¿ String,
  #[structopt(short = "-n", long)]
  line_number: bool,
}
オプションが追加されたことの確認
- 次のように --helpオプションをつけて、cargo コマンドを実行します
- -nオプションが存在していれば成功です
- --helpや- --versionは、structopt を Derive した際に追加されています
% cargo run -- --help
(中略)
mygrep 0.1.0
USAGE:
    mygrep [FLAGS] <PATTERN> <FILE>
FLAGS:
    -h, --help           Prints help information
    -n, --line-number
    -V, --version        Prints version information
ARGS:
    <PATTERN>
    <FILE>
-n を実装します
- grep の第 1 引数を、MyGrep オブジェクトに変更します
fn grep(mygrep: MyGrep, content: String){
  let mut line_number = 1;
  for line in content.lines(){
    if line.contains(mygrep.pattern.as_str()){
      if mygrep.line_number {
        println!("{}: {}", line_number, line);
      }else{
        println!("{}", line);
      }
    }
    line_number += 1;
  }
}
grep のシグネチャ変更にあわせて、run も変更します
fn run(mygrep: MyGrep){
  match std::fs::read_to_string(mygrep.path) {
    Ok(content) => grep(mygrep, content),
    Err(reason) => println!("{}", reason)
  }  
}
所有権の移動に伴うコンパイルエラー
- mygrep.pathの値は- read_to_stringの引数に所有権が移動しています
- 所有権が移動したフィールドをもつオブジェクトを利用しているので、コンパイルエラーがおきます
- 所有権は代入や、関数呼び出しによって移動します
error[E0382]: use of partially moved value: `mygrep`
  --> src/main.rs:68:25
   |
67 |   match std::fs::read_to_string(mygrep.path) {
   |                                 ----------- value partially moved here
68 |     Ok(content) => grep(mygrep, content),
   |                         ^^^^^^ value used here after partial move
   |
   = note: partial move occurs because `mygrep.path` has type `String`, which does not implement the `Copy` trait
error: aborting due to previous error
For more information about this error
名前と値
- Rust では =で行う行為を束縛と呼びます
- letで宣言するのは名前です。
- =は値に変数を結びつけると考えるため束縛と呼ばれます
- 下記の例では、chikoとanother_chikoは異なる値に束縛されています
struct Person{
  name: String
}
let chiko = Person{name: "Chiko".to_string()};
let another_chiko = Person{name: "Chiko".to_string()};
所有権の移動
- Rust で値に束縛される名前は 1 つまでとなっています
- ある値が他の名前に束縛された時、元の名前はその値に束縛されなくなります
- このことを所有権の移動(move)と呼びます
- 下記のコードは、chikoに束縛されていた値を、所有権の移動後に参照するためコンパイルエラーとなります
let chiko = Person{name: "Chiko".to_string()};
let another_chiko = chiko;
println!("{}", chiko.name);
所有権の移動と関数呼び出し
- 所有権の移動は関数呼び出しでも起こります
- それは関数の仮引数(名前)が、実引数(値)に束縛されるためです
- 次の例では、do_somthing呼び出しにchikoから所有権が移動します
let chiko = Person{name: "Chiko".to_string()};
do_somthing(chiko);
let message = format!("Hello, {}", chiko.name);
参照と借用
- 所有権を渡す代わりに、一時的に値を貸し出すこともできます
- 貸し出す場合は、値は参照という形で渡します
- 変数名の前に &をつけることで、値への参照を取得します
fn run(mygrep: MyGrep){
  match std::fs::read_to_string(&mygrep.path) {
    Ok(content) => grep(mygrep, content),
    Err(reason) => println!("{}", reason)
  }  
}
参照
- Rust には参照という概念があります
- 参照とは、ある値を指す値とでも呼ぶもので、値へ間接的にアクセスするために利用します
- &を変数につけることで、それを束縛する値への参照を取得できます
let chiko = Person{name: format!("Chiko")};
let reference = &chiko;
参照と所有権の移動
- 参照を取得した時に、値の所有権は移動しません
- 次の例では、referenceへ値の所有権は移動していません
- そのため、コンパイルエラーとはなりません
let chiko = Person{name: format!("Chiko")};
let reference = &chiko;
let message = format!("{}", chiko.name);
借用:borrowing
- 関数が参照を引数とすることを「借用(borrowing)」と呼びます
- 次の do_somethingは参照を引数として受け取ります
- この関数を呼び出した時、chikoを束縛する値の所有権は移動しません
- そのため、最後の行はコンパイルエラーとはなりません
fn do_something(person: &Person){
  println!("Hello, {}!", person.name);
}
fn main(){
  let chiko = Person{name: format!("Chiko")};
  do_something(&chiko);
  let message = format!("Hello, {}!", chiko.name);
}
所有権が移動した後の借用
- 次の例では greetを呼び出し時に所有権が移動します
- 所有権が移動した値は、関数呼び出し後に消滅します
- 消滅後 reference経由で値を参照しているので、コンパイルエラーとなります
fn greet(person: Person){
  println!("Hello, {}", person.name);
}
fn main() {
  let chiko = Person{name: format!("Chiko")};
  let reference = &chiko;
  greet(chiko);
  println!("{}", reference.name);
}
所有権移動後の借用によるエラーメッセージ
error[E0505]: cannot move out of `chiko` because it is borrowed
  --> src/main.rs:13:11
   |
11 |     let reference = &chiko;
   |                     ------ borrow of `chiko` occurs here
12 |     println!("{}", reference.name);
13 |     greet(chiko);
   |           ^^^^^ move out of `chiko` occurs here
14 |     println!("{}", reference.name);
   |                    -------------- borrow later used here
ここまでの状態
use structopt::StructOpt;
#[derive(StructOpt)]
#[structopt(name="mygrep")]
struct MyGrep{
  #[structopt(name = "PATTERN")]
  pattern: String,
  #[structopt(name = "FILE")]
  path: String,
  #[structopt(short = "-n", long)]
  line_number: bool,
}
fn grep(mygrep: MyGrep, content: String){
  let mut line_number = 1;
  for line in content.lines(){
    if line.contains(mygrep.pattern.as_str()){
      let prefix = if mygrep.line_number {
        format!("{}:", line_number)
      }else{
        format!("")
      };
      println!("{}{}", prefix, line)
    }
    line_number += 1;
  }
}
fn run(mygrep: MyGrep){
  match std::fs::read_to_string(&mygrep.path) {
    Ok(content) => grep(mygrep, content),
    Err(reason) => println!("{}", reason)
  }  
}
fn main(){
  let mygrep = MyGrep::from_args();
  run(mygrep);
}
複数のファイルを処理できるように
- grep は複数のファイルを処理できます
- 複数ファイルを処理している場合、先頭にファイル名をつけて結果を出力します
% grep version Cargo.*
grep version Cargo.*
Cargo.lock:version = "0.11.0"
Cargo.lock:version = "0.2.14"
Cargo.toml:version = "0.1.0"
MyGrep を修正します
- pathの型を- Vec<String>に変更します
- Vecは可変長の配列です
- 要素の型をパラメータで指定します
#[derive(StructOpt)]
#[structopt(name="mygrep")]
struct MyGrep{
  #[structopt(short = "-n", long)]
  line_number: bool,
  #[structopt(name = "PATTERN")]
  pattern: String,
  #[structopt(name = "FILE")]
  path: Vec<String>,  
}
path を走査するように run を変更します
- Vecにはイテレーターを返すメソッド- iterがあります
- これを利用して pathを走査します
fn run(mygrep: MyGrep){
  for file in mygrep.path.iter(){
   match std::fs::read_to_string(file) {
      Ok(content) => grep(mygrep, content),
      Err(reason) => println!("{}", reason)
    }  
  }
}
grep のシグネチャを変更します
- grepは何度も呼ばれる可能性があります
- 呼び出しによって MyGrepの所有権が移動すると、2 回目以降の処理に差し障ります
- MyGrepを借用するようにシグネチャを変更します
fn grep(mygrep: &MyGrep, content: String){
  let mut line_number = 1;
  for line in content.lines(){
    if line.contains(mygrep.pattern.as_str()){
      let prefix = if mygrep.line_number {
        format!("{}:", line_number)
      }else{
        format!("")
      };
      println!("{}{}", prefix, line)
    }
    line_number += 1;
  }
}
ファイル名を出力する機能を実装します
- Vecの持つ- lenメソッドを呼ぶと、要素数を取得できます
- 処理中のファイル名は引数で与えられることします
fn grep(mygrep: &MyGrep, content: String, file_name: &str){
  let mut line_number = 1;
  for line in content.lines(){
    if line.contains(mygrep.pattern.as_str()){
      let prefix_line_number = if mygrep.line_number {
        format!("{}:", line_number)
      }else{
        format!("")
      };
      let prefix_file_name = if mygrep.path.len() > 1{
        format!("{}:", file_name)
      }else{
        format!("")
      };
      println!("{}{}{}", prefix_file_name, prefix_line_number, line)
    }
    line_number += 1;
  }
}
呼び出し側も変更します
use structopt::StructOpt;
#[derive(StructOpt)]
#[structopt(name="mygrep")]
struct MyGrep{
  #[structopt(short = "-n", long)]
  line_number: bool,
  #[structopt(name = "PATTERN")]
  pattern: String,
  #[structopt(name = "FILE")]
  path: Vec<String>,  
}
fn grep(mygrep: &MyGrep, content: String, file_name: &str){
  let mut line_number = 1;
  for line in content.lines(){
    if line.contains(mygrep.pattern.as_str()){
      let prefix_line_number = if mygrep.line_number {
        format!("{}:", line_number)
      }else{
        format!("")
      };
      let prefix_file_name = if mygrep.path.len() > 1{
        format!("{}:", file_name)
      }else{
        format!("")
      };
      println!("{}{}{}", prefix_file_name, prefix_line_number, line)
    }
    line_number += 1;
  }
}
fn run(mygrep: MyGrep){
  for file in mygrep.path.iter(){
   match std::fs::read_to_string(file) {
      Ok(content) => grep(&mygrep, content, file),
      Err(reason) => println!("{}", reason)
    }  
  }
}
fn main(){
  let mygrep = MyGrep::from_args();
  run(mygrep);
}
拡張例:-r オプションを実装しよう
- -rオプションは、指定されたパターンを正規表現として解釈するオプションです
- 正規表現は regex クレートで実現されています
- まず Cargo.tomlを編集して regex クレートを読み込んだ上で、main.rsに機能を実装します
拡張例:run を MyGrep のメソッドにしよう
- runはトップレベルに実装された関数でした
- これを MyGrepのメソッドとなるように変更します
- 変更後の、main関数は次のようになります
fn main(){
  let mygrep = MyGrep::from_args();
  mygrep.run();
}
self を引数にとる関数
- selfを引数にとる関数をデータ構造に実装することで、そのデータ構造にメソッドを追加できます
- メソッド呼び出し時、selfはメソッドのレシーバーに束縛されます
- 次の例では、Peanoという構造体にsuccというメソッドを追加しています
struct Peano{
  value: u32
}
impl Peano{
  fn zero() -> Peano{ 
    Peano{value: 0}
  }
  fn succ(&self) -> Peano{
    Peano{value: self.value + 1}
  }
}
fn main(){
  let zero = Peano::zero();
  let one = zero.succ();
  println!("zero = {}, one = {}", zero.value, one.value);
}
self か &self か
- メソッドの第 1 引数は、selfもしくは&selfとなります
- 前者ではメソッド呼び出し時に、自身の所有権が仮引数に移動します。後者では、所有権が移動しません
struct Peano{
  value: u32
}
impl Peano{
  fn zero() -> Peano{ 
    Peano{value: 0}
  }
  fn succ(self) -> Peano{
    Peano{value: self.value + 1}
  }
}
fn main(){
  let zero = Peano::zero();
  let one = zero.succ();
}
メソッド呼び出しによる所有権の移動
- succを呼び出した時点で- zeroに束縛されていた値の所有権が移動しています
- 一方 println!では所有権の移動した値を参照しています
- そのため以下の例は、コンパイルエラーとなります
struct Peano{
  value: u32
}
impl Peano{
  fn zero() -> Peano{ 
    Peano{value: 0}
  }
  fn succ(self) -> Peano{
    Peano{value: self.value + 1}
  }
}
fn main(){
  let zero = Peano::zero();
  let one = zero.succ();
  println!("zero = {}, one = {}", zero.value, one.value);
}
拡張例:Rayon を使った並列化
- Rust には並列プログラムを安全に記述できるという強みがあります
- その強みを生かした crate に Rayon があります
- par_iterを呼ぶことで、イテレーターに対する処理を並列化できます
まとめ:扱ったテーマ
- 変数、制御構造、関数定義と呼び出し、ユーザー定義型と振る舞いの実装
- ユーザー定義型、所有権
- crate
扱わなかったテーマ
- ライフタイム、所有権の共有
- 標準ライブラリー、コレクション型
- モジュールシステム
- 並列処理、非同期処理