RiscV ISA デコーダ

このチュートリアルの目的は次のとおりです。

MPACT-Sim シミュレータで命令がどのように表示されるかを学びます。
ISA ディスクリプションファイルの構造と構文について説明します。
RiscV RV32I 命令のサブセットの ISA 説明を作成する

概要

MPACT-Sim では、ターゲット命令がデコードされ、内部より可用性が高くなり、データのセマンティクスが実行時間を短縮できます。これらの命令インスタンスは、命令ブロックのキャッシュに頻繁に実行される命令の数を減らすために、キャッシュに実行されます。

指示クラス

始める前に、命令が何であるかを少し確認しておきましょう。表します。Instruction クラスは、 mpact-sim/mpact/sim/generic/instruction.h.

Instruction クラスのインスタンスには、タスクの実行に必要なすべての情報が命令が「実行された」ときに、次のようにシミュレートします。

命令アドレス、シミュレートされた命令サイズ、つまり .text のサイズ。
命令オペコード。
述語オペランドインターフェースポインタ（該当する場合）。
ソースオペランドインターフェースポインタのベクトル。
宛先オペランドインターフェースポインタのベクトル。
セマンティック関数の呼び出し可能。
アーキテクチャ状態オブジェクトへのポインタ。
コンテキストオブジェクトへのポインタ。
子インスタンスと次の命令インスタンスへのポインタ。
逆アセンブル文字列。

これらのインスタンスは通常、命令（インスタンス）キャッシュに保存されます。命令が再実行されるたびに再利用されます。これにより作成されます。

コンテキストオブジェクトへのポインタを除き、すべて ISA の記述から生成される命令デコーダ。今回このチュートリアルでは、これらのアイテムの詳細を直接使用します。その使われ方を大まかに把握しておくと、十分です

セマンティック関数の呼び出し可能オブジェクトは C++ の関数/メソッド/関数オブジェクト（ラムダを含む）。命令のセマンティクスを実装します。対象たとえば、add 命令の場合、各ソースオペランドを読み込み、2 つの結果を単一の宛先オペランドに書き込みます。トピックセマンティック関数については、セマンティクス関数のチュートリアルで詳しく説明します。

命令オペランド

この命令クラスには、次の 3 種類のオペランドインターフェースへのポインタが含まれています。 source、destination です。これらのインターフェースを使用すると、セマンティック関数を基になる命令の実際の型に関係なく記述できるオペランド。たとえば、レジスタと即値の値へのアクセスは、同じインターフェースからアクセスできます。つまり、同じ処理を実行する命令は異なるオペランド（レジスタと immedates など）では、実装されています。

述語オペランドインターフェース（述語オペランドをサポートする ISA 用）命令の実行（他の ISA の場合は null）を使用して、命令の実行が述語のブール値に基づいて特定の命令を実行する必要があります。

// The predicte operand interface is intended primarily as the interface to
// read the value of instruction predicates. It is separated from source
// predicates to avoid mixing it in with the source operands needed for modeling
// the instruction semantics.
class PredicateOperandInterface {
 public:
  virtual bool Value() = 0;
  // Return a string representation of the operand suitable for display in
  // disassembly.
  virtual std::string AsString() const = 0;
  virtual ~PredicateOperandInterface() = default;
};

ソースオペランドインターフェースを使用すると、命令セマンティック関数は、基になるオペランドに関係なく、命令オペランドから値あります。インターフェースメソッドは、スカラー値とベクトル値オペランドの両方をサポートします。

// The source operand interface provides an interface to access input values
// to instructions in a way that is agnostic about the underlying implementation
// of those values (eg., register, fifo, immediate, predicate, etc).
class SourceOperandInterface {
 public:
  // Methods for accessing the nth value element.
  virtual bool AsBool(int index) = 0;
  virtual int8_t AsInt8(int index) = 0;
  virtual uint8_t AsUint8(int index) = 0;
  virtual int16_t AsInt16(int index) = 0;
  virtual uint16_t AsUint16(int) = 0;
  virtual int32_t AsInt32(int index) = 0;
  virtual uint32_t AsUint32(int index) = 0;
  virtual int64_t AsInt64(int index) = 0;
  virtual uint64_t AsUint64(int index) = 0;

  // Return a pointer to the object instance that implements the state in
  // question (or nullptr) if no such object "makes sense". This is used if
  // the object requires additional manipulation - such as a fifo that needs
  // to be pop'ed. If no such manipulation is required, nullptr should be
  // returned.
  virtual std::any GetObject() const = 0;

  // Return the shape of the operand (the number of elements in each dimension).
  // For instance {1} indicates a scalar quantity, whereas {128} indicates an
  // 128 element vector quantity.
  virtual std::vector<int> shape() const = 0;

  // Return a string representation of the operand suitable for display in
  // disassembly.
  virtual std::string AsString() const = 0;

  virtual ~SourceOperandInterface() = default;
};

宛先オペランドインターフェースは割り当てと処理のメソッドを提供する DataBuffer インスタンス（レジスタ値を格納するために使用される内部データ型）。宛先オペランドにもレイテンシが関連付けられていますこの命令によって割り当てられたデータバッファインスタンスがセマンティック関数を使用して、ターゲットレジスタの値を更新します。対象たとえば、add 命令のレイテンシは 1 で、mpy 命令のレイテンシは 1 です。 4 でもかまいません。これについてはこのモジュールのセマンティック関数に関するチュートリアルへようこそ

// The destination operand interface is used by instruction semantic functions
// to get a writable DataBuffer associated with a piece of simulated state to
// which the new value can be written, and then used to update the value of
// the piece of state with a given latency.
class DestinationOperandInterface {
 public:
  virtual ~DestinationOperandInterface() = default;
  // Allocates a data buffer with ownership, latency and delay line set up.
  virtual DataBuffer *AllocateDataBuffer() = 0;
  // Takes an existing data buffer, and initializes it for the destination
  // as if AllocateDataBuffer had been called.
  virtual void InitializeDataBuffer(DataBuffer *db) = 0;
  // Allocates and initializes data buffer as if AllocateDataBuffer had been
  // called, but also copies in the value from the current value of the
  // destination.
  virtual DataBuffer *CopyDataBuffer() = 0;
  // Returns the latency associated with the destination operand.
  virtual int latency() const = 0;
  // Return a pointer to the object instance that implmements the state in
  // question (or nullptr if no such object "makes sense").
  virtual std::any GetObject() const = 0;
  // Returns the order of the destination operand (size in each dimension).
  virtual std::vector<int> shape() const = 0;
  // Return a string representation of the operand suitable for display in
  // disassembly.
  virtual std::string AsString() const = 0;
};

ISA の説明

プロセッサの ISA（命令セットアーキテクチャ）は抽象モデルを定義するソフトウェアがハードウェアと相互作用します。トレーニングデータに含まれるデータ型、レジスタ、その他のマシン状態をその動作（セマンティクス）を確認できます。目的 MPACT-Sim では、ISA に命令の実際のエンコードは含まれません。この情報は個別に扱われます。

プロセッサの ISA は、インフラストラクチャの抽象化、エンコーディング非依存レベルで実行できます。説明ファイル使用可能な命令セットを列挙します。命令ごとに、その名前、オペランドの数と名前、セマンティクスを実装する C++ 関数/呼び出し可能オブジェクトへのバインド。また逆アセンブルした書式設定文字列を指定でき、命令でのハードウェアリソース名を指定します。前者は、テキストプロンプトを生成するのにデバッグ、トレース、インタラクティブ使用のための命令の表現。「後者を使用すると、シミュレーションでより正確なサイクル精度を構築できます。

ISA 記述ファイルは isa-parser によって解析され、表現に依存しない命令デコーダです。このデコーダは、入力シーケンスの指示オブジェクトのフィールドに入力できます。具体的な値は、デスティネーションレジスタ番号。フォーマット固有の命令から取得使用します。そのようなデコーダの一つがバイナリデコーダで、説明します

このチュートリアルでは、シンプルなスカラーの ISA 記述ファイルを記述する方法について説明します。説明します。RiscV RV32I 命令セットのサブセットを使用して、他のチュートリアルとともに、Google Cloud の「Hello World」をシミュレートする。RiscV ISA について詳しくは、以下をご覧ください。 Risc-V の仕様。

まず、ファイルを開きます。 riscv_isa_decoder/riscv32i.isa

ファイルの内容は複数のセクションに分割されています。1 つ目は ISA です宣言:

isa RiscV32I {
  namespace mpact::sim::codelab;
  slots { riscv32; }
}

これにより、RiscV32I が ISA の名前として宣言され、コード生成ツールが API 呼び出しを定義する RiscV32IEncodingBase というクラスを作成します。オペランドとオペランド情報を取得するために、生成されたデコーダが使用します。名前このクラスは、ISA 名をパスカルケースに変換して生成されます。 EncodingBase で連結します。宣言 slots { riscv32; } RiscV32I 内に命令スロット riscv32 が 1 つしかないことを指定します。 ISA（VLIW 命令内の複数のスロットとは対照的）であり、有効な命令は、riscv32 で実行するように定義されている命令です。

// First disasm fragment is 15 char wide and left justified.
disasm widths = {-15};

これは、任意の逆アセンブルされたオブジェクトの最初の逆アセンブルフラグメントが、仕様（下記参照）は左揃えで半角 15 文字（全角 7 文字）で指定します。あります。後続のフラグメントは、このフィールドに何も追加されず、スペースの追加はお控えください。

その下には、riscv32i、zicsr、riscv32 の 3 つのスロット宣言があります。上記の isa の定義に基づき、riscv32 に対して定義された手順のみ RiscV32I isa の一部になります。他の 2 つのスロットの目的は何ですか。

スロットを使用して命令を別々のグループに分解し、そのグループに最後に 1 つのスロットに統合されます: riscv32i, zicsr という表記に注目してください。を riscv32 スロット宣言内で指定します。これは、スロット riscv32 が継承するように指定します。スロット zicsr および riscv32i で定義されたすべての命令。RiscV 32 ビット ISA RV32I と呼ばれる基本 ISA で構成されており、オプションの拡張機能のセットはこれに対して追加できます。スロットメカニズムを使用すると、これらの拡張機能内の命令に個別に指定し、最後に必要に応じて組み合わせて、理解することが重要です。この場合、RisvV の「I」セクションの定義できます。「zicsr」という名前のものとは別にできます。追加のグループを定義可能「M」(乗算/除算)、'F'（単精度浮動小数点）、'D' （倍精度浮動小数点数）、'C'（コンパクトな 16 ビット命令）などがこれに該当します。望ましい最終的な RiscV ISA に必要な要素です。

// The RiscV 'I' instructions.
slot riscv32i {
  ...
}

// RiscV32 CSR manipulation instructions.
slot zicsr {
  ...
}

// The final instruction set combines riscv32i and zicsr.
slot riscv32 : riscv32i, zicsr {
  ...
}

zicsr スロットと riscv32 スロットの定義を変更する必要はありません。ただし、このチュートリアルでは、必要な定義を riscv32i に追加することに重点を置いています。あります。このスロットで現在定義されている内容を詳しく見てみましょう。

// The RiscV 'I' instructions.
slot riscv32i {
  // Include file that contains the declarations of the semantic functions for
  // the 'I' instructions.
  includes {
    #include "learning/brain/research/mpact/sim/codelab/riscv_semantic_functions/solution/rv32i_instructions.h"
  }
  // These are all 32 bit instructions, so set default size to 4.
  default size = 4;
  // Model these with 0 latency to avoid buffering the result. Since RiscV
  // instructions have sequential semantics this is fine.
  default latency = 0;
  // The opcodes.
  opcodes {
    fence{: imm12 : },
      semfunc: "&RV32IFence"c
      disasm: "fence";
    ebreak{},
      semfunc: "&RV32IEbreak",
      disasm: "ebreak";
  }
}

まず、includes {} セクションがあります。ここには、必要なヘッダーファイルが生成コードに含めるには、このスロットが直接参照されるか、最終的な ISA で間接的に行われます。インクルードファイルは、グローバルな名前空間でスコープの includes {} セクション。この場合、常に含まれます。これにより、そうしないと、同じインクルードファイルをすべてのスロットに追加する必要がある場合に便利定義します。

これは、default size 宣言と default latency 宣言で定義します。ただし、特に指定しなければ、命令のサイズは 4 であり、命令の宛先オペランドの書き込みサイクルは 0 サイクルです。注意すべき点は、命令のサイズをこれは、プログラムカウンタの値を計算するためのシミュレートされたシーケンスで次に実行するシーケンシャル命令のアドレスあります。このファイルのサイズ（バイト単位）と異なってもかまいません。入力実行可能ファイル内の命令表現です。

スロットの定義の中心は、オペコードセクションです。ご覧のとおり、2 つしかオペコード（命令）fence および ebreak はこれまでに定義されました。 riscv32i。fence オペコードは、名前（fence）とオペランド指定（{: imm12 : }）の後にオプションの逆アセンブルが続く形式（"fence"）、セマンティックとしてバインドされる呼び出し可能オブジェクト関数（"&RV32IFence"）を使用します。

命令オペランドは、各コンポーネントが 1 つずつ、述語「:」をセミコロンで区切るソースオペランドリスト ':' 宛先オペランドリスト。送信元と宛先のオペランドリストはカンマですオペランド名の区切りリストを使用します。ご覧のとおり、この演算の命令オペランドは fence 命令に述語オペランドがなく、ソースが 1 つだけ含まれているオペランド名 imm12、宛先オペランドなし。RiscV RV32I サブセットは、述語実行をサポートしていないため、述語オペランドは常に空になる使用します。

セマンティック関数は、C++ コードセマンティック関数の呼び出しに使用する関数または呼び出し可能オブジェクトです。署名のセマンティック関数/呼び出し可能オブジェクトは void(Instruction *) である。

逆アセンブル仕様は、文字列のカンマ区切りリストで構成されます。通常、2 つの文字列のみが使用されます。1 つはオペコード用、もう 1 つはオペコード用です。オペランドになりますフォーマット（手順の AsString() 呼び出しを使用）すると、文字列は disasm widths に従ってフィールド内にフォーマットされます。必要があります。

次の演習は、riscv32i.isa ファイルに手順を追加する際に役立ちます。「Hello World」をシミュレートするのに十分。お急ぎの場合は、ソリューションについては riscv32i.isa および rv32i_instructions.h です。

初期ビルドを実行する

ディレクトリを riscv_isa_decoder に変更していない場合は、この時点で変更します。その後次のようにプロジェクトをビルドします。このビルドは成功するはずです。

$ cd riscv_isa_decoder
$ bazel build :all

ディレクトリをリポジトリのルートに戻して検証できます。そのためには、ディレクトリを bazel-out/k8-fastbuild/bin/riscv_isa_decoder（x86 host 「k8-fastbuild」は別の文字列になります。

$ cd ..
$ cd bazel-out/k8-fastbuild/bin/riscv_isa_decoder

このディレクトリには、他のファイルと一緒に、次のものが含まれます。生成された C++ ファイル:

riscv32i_decoder.h
riscv32i_decoder.cc
riscv32i_enums.h
riscv32i_enums.cc

ブラウザで riscv32i_enums.h をクリックして見てみましょう。すべきこと次のような内容が含まれていることがわかります。

#ifndef RISCV32I_ENUMS_H
#define RISCV32I_ENUMS_H

namespace mpact {
namespace sim {
namespace codelab {
  enum class SlotEnum {
    kNone = 0,
    kRiscv32,
  };

  enum class PredOpEnum {
    kNone = 0,
    kPastMaxValue = 1,
  };

  enum class SourceOpEnum {
    kNone = 0,
    kCsr = 1,
    kImm12 = 2,
    kRs1 = 3,
    kPastMaxValue = 4,
  };

  enum class DestOpEnum {
    kNone = 0,
    kCsr = 1,
    kRd = 2,
    kPastMaxValue = 3,
  };

  enum class OpcodeEnum {
    kNone = 0,
    kCsrs = 1,
    kCsrsNw = 2,
    kCsrwNr = 3,
    kEbreak = 4,
    kFence = 5,
    kPastMaxValue = 6
  };

  constexpr char kNoneName[] = "none";
  constexpr char kCsrsName[] = "Csrs";
  constexpr char kCsrsNwName[] = "CsrsNw";
  constexpr char kCsrwNrName[] = "CsrwNr";
  constexpr char kEbreakName[] = "Ebreak";
  constexpr char kFenceName[] = "Fence";
  extern const char *kOpcodeNames[static_cast<int>(
      OpcodeEnum::kPastMaxValue)];

  enum class SimpleResourceEnum {
    kNone = 0,
    kPastMaxValue = 1
  };

  enum class ComplexResourceEnum {
    kNone = 0,
    kPastMaxValue = 1
  };

  enum class AttributeEnum {
    kPastMaxValue = 0
  };

}  // namespace codelab
}  // namespace sim
}  // namespace mpact

#endif  // RISCV32I_ENUMS_H

ご覧のとおり、各スロット、オペコード、オペランドは、 riscv32i.isa ファイルがいずれかの列挙型で定義されています。さらに、 OpcodeNames 配列には、すべてのオペコードの名前が格納されています（ riscv32i_enums.cc で定義）。その他のファイルには生成されたデコーダ、これについては別のチュートリアルで詳しく説明します

Bazel ビルドルール

Bazel の ISA デコーダターゲットは、 mpact_isa_decoder（mpact/sim/decoder/mpact_sim_isa.bzl から読み込まれます）（mpact-sim リポジトリ）。このチュートリアルでは、ビルドターゲットが riscv_isa_decoder/BUILD は:

mpact_isa_decoder(
    name = "riscv32i_isa",
    src = "riscv32i.isa",
    includes = [],
    isa_name = "RiscV32I",
    deps = [
        "//riscv_semantic_functions:riscv32i",
    ],
)

このルールは ISA パーサーツールと生成ツールを呼び出して C++ コードを生成します。生成されたライブラリは、他のルールが依存できるライブラリにコンパイルします。ラベル //riscv_isa_decoder:riscv32i_isa。includes セクションが使用されているソースファイルに含めることができる追加の .isa ファイルを指定します。「 isa_name は、特定の isa を指定するために使用されます。複数の isa がある場合は必須です。デコーダを生成するソースファイル内で指定されます。

レジスタ / レジスタ ALU 命令の追加

次に、riscv32i.isa ファイルに新しい指示を追加します。最初の命令のグループは、add などのレジスタ / レジスタ ALU 命令です。 and など。RiscV32 では、これらはすべて R 型のバイナリ命令形式を使用します。

31 ～ 25	24 ～ 20	19 ～ 15	14 ～ 12	11 ～ 7	6 ～ 0
7	5	5	3	5	7
func7	rs2	rs1	func3	日	オペコード

.isa ファイルは形式に依存しないデコーダの生成に使用されますが、バイナリ形式とそのレイアウトを検討するとエントリーに役立ちます。皆さんがデコーダに関連する 3 つのフィールドがあり、命令オブジェクト: rs2、rs1、rd。今回は同じ方法でエンコードされた整数レジスタの名前（ビットシーケンス）同じ命令フィールド、すべての命令で、

追加する手順は次のとおりです。

add - 整数の加算。
and - ビット演算 AND。
or - ビット単位の OR。
sll - 左にシフトします。
sltu - 小なり記号を符号なしに設定します。
sub - 整数の減算。
xor - ビット単位の XOR。

これらの各手順は、Terraform の opcodes セクションに riscv32i スロットの定義。前に説明したように、オペコードの名前、オペコード、セマンティック関数が含まれています。名前は簡単です。上記のオペコード名を使用します。また、それらはすべて同じオペランドを使用するため、オペランドの指定には { : rs1, rs2 : rd} を使用できます。つまり rs1 により指定されるレジスタソースオペランドは、インデックス 0 を持ちます。命令オブジェクト内のオペランドベクトル、指定されたレジスタソースオペランド rs2 によって指定されるレジスタ宛先のオペランドは、インデックス 1 を持ち、rd によって指定されるレジスタ宛先のオペランドになります。が宛先オペランドベクトル（インデックス 0）内の唯一の要素になります。

次はセマンティック関数の仕様です。これには semfunc と、割り当てに使用できる呼び出し可能オブジェクトを指定する C++ 文字列 std::function にマッピング。このチュートリアルでは関数を使用するため、呼び出し可能文字列は "&MyFunctionName" になります。Terraform が推奨する命名規則を使用して、 fence 命令。これらは "&RV32IAdd"、"&RV32IAnd" などになります。

最後は逆アセンブル仕様です。キーワード disasm で始まり、その後にカンマ区切りの文字列リストが続きます。文字列として出力されるはずです。% 記号をオペランド名は、表します。add 命令の場合、disasm: "add", "%rd, %rs1,%rs2" のようになります。つまり、add 命令のエントリは次のようになります。例:

    add{ : rs1, rs2 : rd},
      semfunc: "&RV32IAdd",
      disasm: "add", "%rd, %rs1, %rs2";

では、riscv32i.isa ファイルを編集して、これらの指示をすべて .isa の説明。サポートが必要な場合（または作業内容を確認したい場合）は、説明ファイルはこちらをご覧ください。

指示を riscv32i.isa ファイルに追加したら、それが必要になります。新しいセマンティック関数のそれぞれに対して、次の場所にあるファイル rv32i_instructions.h が参照されます: `../semantic_functions/.繰り返しになりますが、サポートが必要な場合（または作業内容を確認したい場合）は、答えはこちらをご覧ください。

すべて完了したら、riscv_isa_decoder に戻ります。再ビルドします。生成されたソースファイルを自由に確認できます。

即時に ALU 命令を追加する

次に追加する ALU 命令は、イミディエイト値を使用します。この 3 つのグループは、指示（即時フィールドに基づく）: I タイプの即時指示 12 ビットの符号付き即値（I-Type 即値命令）があります。 U 型即値型（20 ビットの符号なし即値）があります。形式は次のとおりです。

I-Type 即時形式:

31 ～ 20	19 ～ 15	14 ～ 12	11 ～ 7	6 ～ 0
12	5	3	5	7
imm12	rs1	func3	日	オペコード

専用の I 型即時形式:

31 ～ 25	24 ～ 20	19 ～ 15	14 ～ 12	11 ～ 7	6 ～ 0
7	5	5	3	5	7
func7	uimm5	rs1	func3	日	オペコード

U-Type 即時形式:

31 ～ 12	11 ～ 7	6 ～ 0
20	5	7
uimm20	日	オペコード

ご覧のとおり、オペランド名の rs1 と rd は同じビットフィールドを参照しています。整数レジスタを表すために使用されます。このため、保持されます。即時値のフィールドは長さと位置が異なり、 2 つ（uimm5 と uimm20）は符号なしですが、imm12 は符号付きです。各それぞれ独自の名前を使用します

したがって、I タイプのオペランドは { : rs1, imm12 :rd } にする必要があります。特殊な I タイプの指示の場合は、{ : rs1, uimm5 : rd} にします。 U 型命令のオペランド指定は { : uimm20 : rd } にする必要があります。

追加する必要のある I タイプの指示は次のとおりです。

addi - 即時を追加します。
andi - ビット演算および即値。
ori - ビット演算または即値。
xori - 即値を伴うビット単位の XOR。

追加する必要がある特殊な I 型命令は次のとおりです。

slli - 即値で左にシフトします。
srai - 算術演算を即値で右にシフトします。
srli - 即値で右に論理シフトします。

追加する必要がある U-Type 命令は次のとおりです。

auipc - 大文字の即値を PC に追加します。
lui - 上限の即時読み込み。

オペコードに使用する名前は、命令名から自然に続くものです（新しいものを考える必要はありません。どれも独自性があります）。データの意味関数を指定しています。前述のように、命令オブジェクトは基になるオペランドに依存しない、ソースオペランドへのインターフェースあります。つまり、命令は同じオペレーションを含み、オペランド型が異なる場合があります。また、同じセマンティック関数を共有できます。たとえば次の場合、addi 命令は add 命令と同じ演算を実行します。オペランド型が無視されるので、同じセマンティック関数を仕様 "&RV32IAdd"。andi、ori、xori、slli も同様です。他の命令では新しいセマンティック関数を使用していますが、これらの関数には必ずオペランドではなく演算に基づいているため、srai には "&RV32ISra" を使用します。「 U-Type 命令 auipc と lui には同等のレジスタがないため、問題ありません。 "&RV32IAuipc" と "&RV32ILui" を使用します。

逆アセンブル文字列は前の演習の文字列とよく似ていますが、想定されるとおり、%rs2 への参照は %imm12、%uimm5 に置き換えられます。または %uimm20 を適宜指定します。

変更を加えてビルドします。生成された出力を確認します。同じ自分の作業内容を riscv32i.isa および rv32i_instructions.h

ブランチとジャンプ&リンクの手順を追加する

追加する必要があるブランチとジャンプ&リンクの手順では、どちらもデスティネーションを使用していますオペランド、つまり次の PC の命令の中でのみあります。この段階で、これを名前を持つ適切なオペランドとして扱います。 next_pc。これについては、後のチュートリアルで詳しく説明します。

ブランチに関する手順

追加するブランチはすべて B-Type エンコードを使用します。

31	30 ～ 25	24 ～ 20	19 ～ 15	14 ～ 12	11 ～ 8	7	6 ～ 0
1	6	5	5	3	4	1	7
うーん	うーん	rs2	rs1	func3	うーん	うーん	オペコード

さまざまな即値を連結して 12 ビットの符号付き即値値に変換するあります。フォーマットにあまり関連性がないため、ここでは「即時」と呼ぶことにします。 bimm12: 12 ビットの即時分岐の場合。断片化への対処にはバイナリデコーダの作成に関する次のチュートリアルに進みましょうすべての分岐命令は、rs1 と rs2 で指定された整数レジスタを比較します。条件が true の場合、即値が現在の PC 値に加算され、次に実行される命令のアドレスを生成します。オペランドは、したがって、分岐命令は { : rs1, rs2, bimm12 : next_pc } である必要があります。

追加する必要があるブランチの指示は次のとおりです。

beq - 等しい場合は分岐します。
bge - 大きいか等しい場合は分岐します。
bgeu - 符号なしより大きいか等しい場合は分岐します。
blt - より小さい場合は分岐します。
bltu - 署名なしの場合は分岐します。
bne - 等しくない場合は分岐します。

これらのオペコード名はすべて一意であるため、.isa で再利用できます。説明します。当然ながら、新しいセマンティック関数名を追加する必要があります（例: "&RV32IBeq" など

逆アセンブルの仕様は少し複雑になります。これは、命令はデスティネーションを実際に計算するのではなく、表します。ただし、Google Cloud で保存されている情報取得できるので、使用可能になります。この問題を解決するには、逆アセンブリ文字列の式構文を使用します。「%」を使わない、オペランド名には、%(expression: print format) と入力できます。非常にシンプル式はサポートされていますが、@ シンボル。印刷形式は C スタイルの printf 形式。ただし、先頭に % はありません。次の逆アセンブル形式を使用すると、 beq 命令は次のようになります。

    disasm: "beq", "%rs1, %rs2, %(@+bimm12:08x)"

ジャンプ&リンクの手順

追加する必要があるのは、ジャンプとリンクの命令の 2 つ、jal（ジャンプとリンク）と、 jalr（間接的なジャンプアンドリンク）。

jal 命令では、J-Type エンコードを使用します。

31	30 ～ 21	20	19 ～ 12	11 ～ 7	6 ～ 0
1	10	1	8	5	7
うーん	うーん	うーん	うーん	日	オペコード

分岐命令の場合と同様に、20 ビットの即値を複数の分岐にわたって断片化します。複数のフィールドがあるため、ここでは jimm20 という名前を付けます。断片化は重要ではないが、次のスライドで作成方法についてのチュートリアルです。オペランド指定は { : jimm20 : next_pc, rd } になります。なお、デスティネーションオペランド、次の PC 値、リンクレジスタできます。

上記の分岐の手順と同様に、逆アセンブル形式は次のようになります。

    disasm: "jal", "%rd, %(@+jimm20:08x)"

間接ジャンプ&リンクは、12 ビット即値を持つ I 型形式を使用します。これは、指定された整数レジスタに符号拡張された即値を加算します。 rs1: ターゲット命令アドレスを生成します。リンクレジスタは、 rd で指定された整数レジスタ。

31 ～ 20	19 ～ 15	14 ～ 12	11 ～ 7	6 ～ 0
12	5	3	5	7
imm12	rs1	func3	日	オペコード

このパターンを見れば、オペランドの仕様が jalr は { : rs1, imm12 : next_pc, rd } である必要があり、逆アセンブルは仕様:

    disasm: "jalr", "%rd, %rs1, %imm12"

変更を加えてからビルドします。生成された出力を確認します。ジャスト前のように、現在の作業内容を riscv32i.isa および rv32i_instructions.h です。

店舗に関する指示を追加する

ストアの手順は非常にシンプルです。これらはすべて S-Type 形式を使用します。

31 ～ 25	24 ～ 20	19 ～ 15	14 ～ 12	11 ～ 7	6 ～ 0
7	5	5	3	5	7
うーん	rs2	rs1	func3	うーん	オペコード

ご覧のとおり、これは断片化された 12 ビット即座の別のケースです。 simm12 とします。すべてのストア命令では、整数の値、つまり rs2 で指定されるレジスタを、メモリ内の実効アドレスに加算します。 rs1 によって指定された整数レジスタの値を、符号拡張された値に 12 ビット即値を使用します。次のオペランド形式は { : rs1, simm12, rs2 } にしてください保存します

実装する必要があるストアの手順は次のとおりです。

sb - バイトを格納します。
sh - ハーフワードを格納します。
sw - 単語を格納します。

sb の逆アセンブル仕様は、次のようになります。

    disasm: "sb", "%rs2, %simm12(%rs1)"

セマンティック関数の仕様も想定どおりです。"&RV32ISb" その他

変更を加えてからビルドします。生成された出力を確認します。ジャスト前のように、現在の作業内容を riscv32i.isa および rv32i_instructions.h です。

読み込み手順の追加

読み込み手順は、他の手順とは若干異なる方法でモデル化されます。表示されます。負荷のレイテンシが 50% を超えるケースをモデル化するには読み込み命令は、次の 2 つのアクションに分けられます。1）有効アドレス計算とメモリアクセス、2）結果の書き戻しです。負荷のセマンティックアクションを 2 つに分割して、メイン命令と子命令があります。さらに、オペランドを指定するときは、main と子命令。そのために、オペランド指定を出力します。構文は以下のとおりです:

{(predicate : sources : destinations), (predicate : sources : destinations), ... }

読み込み命令はすべて、前のバージョンと同様に I-Type 形式を使用します。手順:

31 ～ 20	19 ～ 15	14 ～ 12	11 ～ 7	6 ～ 0
12	5	3	5	7
imm12	rs1	func3	日	オペコード

オペランド指定では、アドレスの計算に必要なオペランドを分割しますそして、ロードデータに対するレジスタのデスティネーションからメモリアクセスを開始します。 {( : rs1, imm12 : ), ( : : rd) }。

セマンティックアクションは 2 つの命令に分割されるため、セマンティック関数は同様に 2 つの呼び出し可能オブジェクトを指定する必要があります。lw（読み込み単語）の場合、次のようになります。記述:

    semfunc: "&RV32ILw", "&RV32ILwChild"

逆アセンブルの仕様は、より標準的な方法です。言及されていないあります。lw の場合は、次のようになります。

    disasm: "lw", "%rd, %imm12(%rs1)"

実装する必要がある読み込み命令は次のとおりです。

lb - バイトを読み込みます。
lbu - 符号なしバイトを読み込みます。
lh - ハーフワードを読み込みます。
lhu - 符号なしハーフワードを読み込みます。
lw - 単語を読み込みます。

変更を加えてからビルドします。生成された出力を確認します。ジャスト前のように、現在の作業内容を riscv32i.isa および rv32i_instructions.h です。

これまでありがとうございます。以上の情報がお役に立てば幸いです。

RiscV ISA デコーダ コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

概要

指示クラス

命令オペランド

ISA の説明

初期ビルドを実行する

Bazel ビルドルール

レジスタ / レジスタ ALU 命令の追加

即時に ALU 命令を追加する

ブランチとジャンプ&リンクの手順を追加する

ブランチに関する手順

ジャンプ&リンクの手順

店舗に関する指示を追加する

読み込み手順の追加

RiscV ISA デコーダ