このページは Cloud Translation API によって翻訳されました。

機械学習用語集: ジェネレーティブ AI

このページでは、生成 AI の用語集の用語について説明します。用語集のすべての用語については、こちらをクリックしてください。

A

自動評価

#language

#generativeAI

ソフトウェアを使用してモデルの出力の品質を判断する。

モデルの出力が比較的単純な場合は、スクリプトまたはプログラムでモデルの出力をゴールドレスポンスと比較できます。このタイプの自動評価は、プログラムによる評価とも呼ばれます。ROUGE や BLEU などの指標は、プログラムによる評価に役立ちます。

モデルの出力が複雑であるか、正解が 1 つではない場合は、自動評価ツールと呼ばれる別の ML プログラムが自動評価を実行することがあります。

人間による評価とは対照的です。

自動評価

#language

#generativeAI

生成 AI モデルの出力の品質を判断するためのハイブリッドメカニズム。人間による評価と自動評価を組み合わせています。自動評価ツールは、人間による評価によって作成されたデータに基づいてトレーニングされた ML モデルです。理想的には、自動評価ツールは人間のエバリュエータを模倣するように学習します。

事前構築された自動評価ツールを使用できますが、最適な自動評価ツールは、評価するタスクに固有にファインチューニングされています。

自己回帰モデル

#language

#image

#generativeAI

独自の過去の予測に基づいて予測を推定するモデル。たとえば、自己回帰言語モデルは、以前に予測されたトークンに基づいて次のトークンを予測します。Transformer ベースの大規模言語モデルはすべて自動回帰型です。

一方、GAN ベースの画像モデルは、ステップで反復処理せずに 1 回の順方向パスで画像を生成するため、通常は自己回帰的ではありません。ただし、特定の画像生成モデルは、画像を段階的に生成するため、自己回帰的です。

C

Chain-of-Thought プロンプト

#language

#generativeAI

大規模言語モデル（LLM）に推論を段階的に説明するように促すプロンプトエンジニアリング手法。たとえば、次のプロンプトについて考えてみましょう。特に 2 番目の文に注意してください。

時速 0 マイルから時速 60 マイルに 7 秒で加速する自動車で、ドライバーが感じる g 力はいくつですか。回答に、関連するすべての計算を示します。

LLM の回答は次のようになります。

0、60、7 の値を適切な場所に挿入して、一連の物理学式を表示します。
これらの数式が選択された理由と、さまざまな変数の意味を説明します。

思考プロセスプロンプトを使用すると、LLM はすべての計算を実行するため、より正確な回答が得られる可能性があります。さらに、思考の流れプロンプトを使用すると、ユーザーは LLM のステップを調べて、回答が妥当かどうかを判断できます。

チャット

#language

#generativeAI

ML システム（通常は大規模言語モデル）とのやり取りの内容。チャットでの以前のやり取り（入力した内容と大規模言語モデルの回答）が、チャットの後続部分のコンテキストになります。

chatbot は大規模言語モデルのアプリケーションです。

コンテキストに応じた言語エンベディング

#language

#generativeAI

流暢な人間の話者のように単語やフレーズを「理解」することに近いエンベディング。コンテキスト化された言語エンベディングは、複雑な構文、セマンティクス、コンテキストを理解できます。

たとえば、英語の単語「cow」のエンベディングについて考えてみましょう。word2vec などの古いエンベディングでは、エンベディング空間における cow から bull までの距離が、ewe（雌羊）から ram（雄羊）までの距離や、female から male までの距離に似ているように、英語の単語を表すことができます。コンテキストに応じた言語エンベディングでは、英語話者が牛または雄牛のいずれかを指すために「cow」という単語を日常的に使用していることを認識することで、さらに一歩進んだことができます。

コンテキストウィンドウ

#language

#generativeAI

モデルが特定のプロンプトで処理できるトークンの数。コンテキストウィンドウが大きいほど、モデルはより多くの情報を使用して、プロンプトに明解で一貫性のある回答を提供できます。

D

直接プロンプト

#language

#generativeAI

ゼロショットプロンプトと同義。

での精製

#generativeAI

1 つのモデル（教師モデル）のサイズを、元のモデルの予測を可能な限り忠実にエミュレートする小規模なモデル（生徒モデル）に縮小するプロセス。蒸留は、小規模なモデルには大規模なモデル（教師）にはない 2 つの重要な利点があるため、有用です。

推論時間の短縮
メモリとエネルギーの使用量の削減

ただし、通常、生徒の予測は教師の予測ほど正確ではありません。

抽出では、生徒モデルと教師モデルの予測の出力の差に基づいて損失関数を最小化するように生徒モデルをトレーニングします。

蒸留と次の用語を比較対照します。

ファインチューニング
プロンプトベースの学習

詳細については、機械学習集中講座の LLM: ファインチューニング、蒸留、プロンプトエンジニアリングをご覧ください。

E

evals

#language

#generativeAI

#Metric

主に LLM 評価の略語として使用されます。より広い意味で、evals はあらゆる形式の評価の略語です。

評価

#language

#generativeAI

#Metric

モデルの品質を測定したり、異なるモデルを比較したりするプロセス。

教師あり機械学習モデルを評価するには、通常、検証セットとテストセットと比較して判断します。LLM の評価には通常、幅広い品質と安全性の評価が含まれます。

F

事実性

#generativeAI

ML の世界では、出力が現実に基づくモデルを記述するプロパティ。事実性は指標ではなく概念です。たとえば、次のようなプロンプトを大規模言語モデルに送信するとします。

食塩の化学式は何ですか。

事実性を最適化するモデルは、次のように返信します。

NaCl

すべてのモデルが事実に基づいていると想定するのは魅力的です。ただし、次のようなプロンプトでは、生成 AI モデルは事実性ではなく創造性を最適化する必要があります。

宇宙飛行士と毛虫についてのライムリークを教えて。

作成されたライムリックが現実に基づいている可能性は低いです。

接地とは対照的です。

少数ショットプロンプト

#language

#generativeAI

大規模言語モデルにどのように回答すればよいかを示す複数の（「少数」の）例を含むプロンプト。たとえば、次の長いプロンプトには、大規模言語モデルにクエリに回答する方法を示す 2 つの例が含まれています。

1 つのプロンプトの一部	メモ
`指定した国の公式通貨は何ですか？`	LLM に回答を求める質問。
`フランス: EUR`	1 つの例を挙げましょう。
`英国: GBP`	別の例をご紹介します。
`インド:`	実際のクエリ。

一般的に、少数ショットプロンプトは、ゼロショットプロンプトやワンショットプロンプトよりも望ましい結果をもたらします。ただし、少数ショットプロンプトでは長いプロンプトが必要になります。

少数ショットプロンプトは、プロンプトベースの学習に適用される少数ショット学習の一種です。

詳細については、機械学習集中講座のプロンプトエンジニアリングをご覧ください。

ファインチューニング

#language

#image

#generativeAI

事前トレーニング済みモデルに対してさらに行うタスク固有のトレーニングです。パラメータを特定のユースケースに合わせて最適化します。たとえば、一部の大規模言語モデルの完全なトレーニングシーケンスは次のとおりです。

事前トレーニング: すべての英語の Wikipedia ページなど、膨大な一般的なデータセットで大規模言語モデルをトレーニングします。
ファインチューニング: 医療に関するクエリへの回答など、特定のタスクを実行するように事前トレーニング済みモデルをトレーニングします。通常、ファインチューニングでは、特定のタスクに焦点を当てた数百または数千のサンプルが使用されます。

別の例として、大規模な画像モデルの完全なトレーニングシーケンスは次のとおりです。

事前トレーニング: 膨大な一般的な画像データセット（ウィキメディアコモンズ内のすべての画像など）で大規模な画像モデルをトレーニングします。
ファインチューニング: オルカの画像の生成など、特定のタスクを実行するように事前トレーニング済みモデルをトレーニングします。

ファインチューニングでは、次の戦略を組み合わせて使用できます。

事前トレーニング済みモデルの既存のパラメータをすべて変更する。これは「完全なファインチューニング」と呼ばれることもあります。
事前トレーニング済みモデルの既存のパラメータの一部のみを変更し（通常は出力レイヤに最も近いレイヤ）、他の既存のパラメータは変更しない（通常は入力レイヤに最も近いレイヤ）。パラメータ効率チューニングをご覧ください。
レイヤを追加します。通常は、出力レイヤに最も近い既存のレイヤの上に追加します。

ファインチューニングは転移学習の一種です。そのため、ファインチューニングでは、トレーニング済みモデルのトレーニングに使用したものとは異なる損失関数やモデルタイプを使用する場合があります。たとえば、事前トレーニング済みの大規模画像モデルをファインチューニングして、入力画像の鳥の数を返す回帰モデルを生成できます。

ファインチューニングと次の用語を比較します。

蒸留
プロンプトベースの学習

詳細については、機械学習集中講座のファインチューニングをご覧ください。

成功率

#generativeAI

#Metric

ML モデルの生成テキストを評価するための指標。成功率は、生成された「成功した」テキスト出力の数を生成されたテキスト出力の合計数で割った値です。たとえば、大規模言語モデルが 10 個のコードブロックを生成し、そのうち 5 個が成功した場合、成功率は 50% になります。

成功率は統計学全体で広く役立ちますが、ML 内では、この指標は主にコード生成や数学の問題など、検証可能なタスクの測定に役立ちます。

G

Gemini

#language

#image

#generativeAI

Google の最先端の AI を構成するエコシステム。このエコシステムの要素には次のようなものがあります。

さまざまな Gemini モデル。
Gemini モデルへのインタラクティブな会話型インターフェース。ユーザーがプロンプトを入力すると、Gemini がそのプロンプトに応答します。
各種 Gemini API。
Gemini モデルに基づくさまざまなビジネスプロダクト（Gemini for Google Cloud など）。

Gemini モデル

#language

#image

#generativeAI

Google の最先端の Transformer ベースのマルチモーダルモデル。Gemini モデルは、エージェントと統合するように特別に設計されています。

ユーザーは、インタラクティブなダイアログインターフェースや SDK など、さまざまな方法で Gemini モデルを操作できます。

生成されたテキスト

#language

#generativeAI

通常、ML モデルが出力するテキストです。大規模言語モデルを評価する場合、一部の指標では、生成されたテキストを参照テキストと比較します。たとえば、ML モデルがフランス語からオランダ語に翻訳する際の有効性を判断するとします。この例の場合は、次のようになります。

生成されたテキストは、ML モデルが出力するオランダ語の翻訳です。
参照テキストは、人間の翻訳者（またはソフトウェア）が作成したオランダ語の翻訳です。

評価戦略によっては、参照テキストが使用されない場合があります。

生成 AI

#language

#image

#generativeAI

正式な定義のない新しい変革分野。ただし、ほとんどの専門家は、生成 AI モデルが次のすべてのコンテンツを作成（「生成」）できると考えています。

複雑
一貫性
オリジナル

たとえば、生成 AI モデルは高度なエッセイや画像を作成できます。

LSTM や RNN などの以前のテクノロジーでも、独自の整合性のあるコンテンツを生成できます。一部の専門家は、これらの初期のテクノロジーを生成 AI と見なしていますが、真の生成 AI には、それらの初期のテクノロジーが生成できるよりも複雑な出力が必要だと考える専門家もいます。

予測 ML とは対照的です。

ゴールデンレスポンス

#language

#generativeAI

正しいと知られている回答。たとえば、次のようなプロンプトがあるとします。

2 + 2

理想的な回答は次のとおりです。

4

ゴールデンレスポンスと参照テキストに関する注記については、こちらをクリックしてください。

ROUGE などの評価指標では、参照テキストとモデルの生成テキストを比較します。プロンプトに正しい回答が 1 つある場合、通常、ゴールデン回答が参照テキストとして使用されます。

一部のプロンプトには正解が 1 つではないものがあります。たとえば、「このドキュメントを要約してください」というプロンプトには、多くの正解がある可能性があります。このようなプロンプトの場合、モデルは非常に幅広い要約を生成できるため、参照テキストは実用的でないことがよくあります。ただし、この状況ではゴールドレスポンスが役立つ場合があります。たとえば、優れたドキュメントの要約を含むゴールドレスポンスを使用することで、自動評価ツールをトレーニングして、優れたドキュメントの要約のパターンを検出できます。

H

人間による評価

#language

#generativeAI

人間が ML モデルの出力の品質を判断するプロセス。たとえば、バイリンガルの人間に ML 翻訳モデルの品質を判断してもらうなどです。人間による評価は、唯一の正解がないモデルの評価に特に役立ちます。

自動評価や自動評価ツールによる評価とは対照的です。

人間参加型（HITL）

#generativeAI

次のいずれかを意味する、あいまいな定義の慣用句。

生成 AI の出力を批判的または懐疑的に見るポリシー。たとえば、この ML 用語集を作成した人間は、大規模言語モデルができることには驚いていますが、大規模言語モデルが犯す間違いには注意しています。
人間がモデルの動作の形成、評価、改善に貢献できるようにする戦略またはシステム。人間をループに維持することで、AI は機械知能と人間知能の両方からメリットを得ることができます。たとえば、AI がコードを生成し、ソフトウェアエンジニアがコードを確認するシステムは、人間がループ内にあるシステムです。

I

コンテキスト内学習

#language

#generativeAI

少数ショットプロンプトと同義。

指示チューニング

#generativeAI

生成 AI モデルが指示に従う能力を向上させるファインチューニングの一種。命令チューニングでは、通常はさまざまなタスクを網羅する一連の命令プロンプトでモデルをトレーニングします。生成された命令チューニング済みモデルは、さまざまなタスクのゼロショットプロンプトに対して有用なレスポンスを生成する傾向があります。

比較対照:

パラメータ効率チューニング
プロンプトチューニング

L

LLM

#language

#generativeAI

大規模言語モデルの略語。

LLM 評価（evals）

#language

#generativeAI

#Metric

大規模言語モデル（LLM）のパフォーマンスを評価するための一連の指標とベンチマーク。LLM 評価の概要は次のとおりです。

研究者が LLM の改善が必要な領域を特定できるようにします。
さまざまな LLM を比較し、特定のタスクに最適な LLM を特定する場合に役立ちます。
LLM を安全かつ倫理的に使用できるようにします。

詳細については、機械学習集中講座の大規模言語モデル（LLM）をご覧ください。

LoRA

#language

#generativeAI

低ランク適応性の略。

Low-Rank Adaptability（LoRA）

#language

#generativeAI

ファインチューニングのためのパラメータ効率的な手法。モデルの事前トレーニング済み重みを「凍結」（変更できなくする）し、トレーニング可能な重みの小さなセットをモデルに挿入します。このトレーニング可能な重みセット（更新行列とも呼ばれます）はベースモデルよりもかなり小さいため、トレーニングが大幅に高速化されます。

LoRA には次の利点があります。

ファインチューニングが適用されるドメインのモデルの予測の品質が向上します。
モデルのすべてのパラメータをファインチューニングする手法よりも高速にファインチューニングできます。
同じベースモデルを共有する複数の特殊モデルの同時提供を可能にすることで、推論の計算コストを削減します。

アイコンをクリックすると、LoRA のアップデートマトリックスの詳細を確認できます。

LoRA で使用される更新マトリックスは、ランク分解マトリックスで構成されています。これは、ベースモデルから派生したもので、ノイズを除去し、モデルの最も重要な特徴にトレーニングを集中させるのに役立ちます。

M

機械翻訳

#generativeAI

ソフトウェア（通常は機械学習モデル）を使用して、ある人間の言語から別の人間の言語にテキストを変換する（例: 英語から日本語に変換する）。

K での平均適合率（mAP@k）

#language

#generativeAI

#Metric

検証データセット全体のすべての 平均適合率（k で）スコアの統計的平均。K での平均適合率の 1 つの用途は、おすすめシステムによって生成されたおすすめの品質を判断することです。

「平均平均」というフレーズは冗長に聞こえますが、指標の名前としては適切です。この指標は、複数の k での平均適合率の平均値を求めます。

アイコンをクリックすると例が表示されます。

ユーザーごとにおすすめの小説のパーソナライズされたリストを生成するレコメンデーションシステムを構築するとします。選択したユーザーからのフィードバックに基づいて、次の 5 つの平均精度（ユーザーごとに 1 つのスコア）を計算します。

0.73
0.77
0.67
0.82
0.76

したがって、K での平均適合率は次のようになります。

$$\text{mean } = \frac{\text{0.73 + 0.77 + 0.67 + 0.82 + 0.76}} {\text{5}} = \text{0.75}$$

専門家集団

#language

#generativeAI

パラメータのサブセット（エキスパート）のみを使用して特定の入力トークンまたは例を処理することで、ニューラルネットワークの効率を高めるスキーム。ゲーティングネットワークは、各入力トークンまたは例を適切なエキスパートに転送します。

詳しくは、次のいずれかの論文をご覧ください。

MMIT

#language

#image

#generativeAI

マルチモーダル指示のチューニング済みの略。

モデルカスケード

#generativeAI

特定の推論クエリに最適なモデルを選択するシステム。

非常に大きいモデル（パラメータが多い）から非常に小さいモデル（パラメータが非常に少ない）まで、さまざまなモデルのグループを想像してみてください。非常に大きなモデルは、小さいモデルよりも推論時に多くの計算リソースを消費します。ただし、通常、非常に大きなモデルは、小さいモデルよりも複雑なリクエストを推論できます。モデルカスケードは、推論クエリの複雑さを決定し、推論を実行する適切なモデルを選択します。モデルカスケードの主な目的は、通常は小規模なモデルを選択し、複雑なクエリにのみ大規模なモデルを選択することで、推論コストを削減することです。

小規模なモデルがスマートフォンで実行され、そのモデルのより大きなバージョンがリモートサーバーで実行されているとします。適切なモデルカスケードを使用すると、小規模なモデルで単純なリクエストを処理し、複雑なリクエストを処理するためにリモートモデルを呼び出すだけで、費用とレイテンシを削減できます。

モデルルーターもご覧ください。

モデルルーター

#generativeAI

モデルカスケードで推論に最適なモデルを決定するアルゴリズム。モデルルータ自体は通常、特定の入力に最適なモデルを選択する方法を徐々に学習する ML モデルです。ただし、モデルルータは、機械学習以外のよりシンプルなアルゴリズムである場合があります。

MOE

#language

#image

#generativeAI

Mixture of Experts の略。

MT

#generativeAI

機械翻訳の略語。

N

正解なし（NORA）

#language

#generativeAI

複数の適切なレスポンスがあるプロンプト。たとえば、次のプロンプトには正解がありません。

ゾウに関するジョークを教えて。

正解のないプロンプトの評価は難しい場合があります。

NORA

#language

#generativeAI

正解は一つではないの略語。

O

ワンショットプロンプト

#language

#generativeAI

大規模言語モデルにどのように回答すればよいかを示す1 つの例を含むプロンプト。たとえば、次のプロンプトには、大規模言語モデルがクエリにどのように回答すればよいかを示す例が 1 つ含まれています。

1 つのプロンプトの一部	メモ
`指定した国の公式通貨は何ですか？`	LLM に回答を求める質問。
`フランス: EUR`	1 つの例を挙げましょう。
`インド:`	実際のクエリ。

ワンショットプロンプトと次の用語を比較します。

ゼロショットプロンプト
少数ショットプロンプト

P

パラメータ効率チューニング

#language

#generativeAI

大規模な事前トレーニング済み言語モデル（PLM）を、完全なファインチューニングよりも効率的にファインチューニングするための一連の手法。パラメータ効率チューニングでは、通常、完全なファインチューニングよりもはるかに少ないパラメータをファインチューニングしますが、通常、完全なファインチューニングから構築された大規模言語モデルと同等（またはほぼ同等）のパフォーマンスを実現する大規模言語モデルが生成されます。

パラメータ効率チューニングと次の方法を比較します。

命令チューニング
プロンプトチューニング

パラメータ効率チューニングは、パラメータエフィシエントファインチューニングとも呼ばれます。

PLM

#language

#generativeAI

事前トレーニング済み言語モデルの略称。

トレーニング後のモデル

#language

#image

#generativeAI

厳密に定義されていない用語で、通常は、次のような 1 つ以上の後処理を行った事前トレーニング済みモデルを指します。

蒸留
ファインチューニング
命令チューニング

事前トレーニング済みモデル

#language

#image

#generativeAI

通常は、すでにトレーニングされているモデルです。この用語は、以前にトレーニングされたエンベディングベクトルを意味する場合もあります。

事前トレーニング済み言語モデルという用語は、通常、すでにトレーニングされている大規模言語モデルを指します。

事前トレーニング

#language

#image

#generativeAI

大規模なデータセットでのモデルの初期トレーニング。事前トレーニング済みモデルの中には、扱いにくい巨大なものがあり、通常は追加のトレーニングで精度を高める必要があります。たとえば、ML の専門家は、Wikipedia のすべての英語ページなど、膨大なテキストデータセットで大規模言語モデルを事前トレーニングする場合があります。事前トレーニングの後、得られたモデルは、次のいずれかの手法でさらに精緻化できます。

蒸留
ファインチューニング
命令チューニング
パラメータ効率チューニング
prompt-tuning

プロンプト

#language

#generativeAI

大規模言語モデルへの入力として入力されるテキスト。これにより、モデルが特定の動作をするように条件付けられます。プロンプトは、フレーズのように短くすることも、小説のテキスト全体のように任意の長さにすることもできます。プロンプトは、次の表に示すような複数のカテゴリに分類されます。

プロンプトカテゴリ	例	メモ
質問	`ハトはどのくらいの速さで飛ぶことができますか？`
手順	`アービトラージに関する面白い詩を書いてください。`	大規模言語モデルに何かを実行するよう求めるプロンプト。
例	`Markdown コードを HTML に変換します。例: マークダウン: * リスト項目 HTML: <ul> <li>リスト項目</li> </ul>`	この例のプロンプトの最初の文は指示です。プロンプトの残りの部分が例です。
ロール	`機械学習のトレーニングで勾配降下法が使用される理由を、物理学の博士号取得者に説明します。`	文の最初の部分は指示です。「物理学博士号」というフレーズは役割の部分です。
モデルが完了する部分入力	`英国の首相は`	部分入力プロンプトは、この例のように突然終了することも、アンダースコアで終了することもできます。

生成 AI モデルは、テキスト、コード、画像、エンベディング、動画など、ほぼすべてのプロンプトに応答できます。

プロンプトベースの学習

#language

#generativeAI

特定のモデルの機能で、任意のテキスト入力（プロンプト）に応じて動作を適応させることができます。一般的なプロンプトベースの学習パラダイムでは、大規模言語モデルがプロンプトに応答してテキストを生成します。たとえば、ユーザーが次のプロンプトを入力したとします。

ニュートンの運動の第 3 法則を要約します。

プロンプトベースの学習が可能なモデルは、前のメッセージに回答するように特別にトレーニングされていません。むしろ、モデルは物理学に関する多くの事実、一般的な言語ルール、一般的に有用な回答を構成する要素を「知っています」。この知識があれば、（うまくいけば）有用な回答を提供できます。人間からの追加のフィードバック（「その回答は複雑すぎる」や「反応はどうだった？」など）により、一部のプロンプトベースの学習システムでは、回答の有用性を徐々に改善できます。

プロンプト設計

#language

#generativeAI

プロンプトエンジニアリングと同義。

プロンプトエンジニアリング

#language

#generativeAI

大規模言語モデルから望ましい回答を引き出すプロンプトを作成する技術。プロンプトのエンジニアリングは人間が行います。適切に構造化されたプロンプトを作成することは、大規模言語モデルから有用なレスポンスを得るために不可欠な要素です。プロンプトエンジニアリングは、次のような多くの要因によって異なります。

大規模言語モデルの事前トレーニングと、必要に応じてファインチューニングに使用されるデータセット。
モデルがレスポンスの生成に使用する温度などのデコードパラメータ。

プロンプト設計はプロンプトエンジニアリングと同義です。

役立つプロンプトの作成について詳しくは、プロンプト設計の概要をご覧ください。

プロンプトチューニング

#language

#generativeAI

システムが実際のプロンプトの前に追加する「接頭辞」を学習するパラメータ効率チューニング メカニズム。

プロンプトチューニングの一種（接頭辞チューニングと呼ばれることもあります）は、すべてのレイヤに接頭辞を追加することです。一方、ほとんどのプロンプトチューニングでは、入力レイヤに接頭辞のみが追加されます。

アイコンをクリックすると、接頭辞の詳細が表示されます。

プロンプトチューニングの場合、「接頭辞」（「ソフトプロンプト」とも呼ばれます）は、実際のプロンプトのテキストトークンエンベディングの前に追加される、学習済みのタスク固有のベクトルのことです。システムは、他のすべてのモデルパラメータをフリーズし、特定のタスクでファインチューニングすることで、ソフトプロンプトを学習します。

R

参照テキスト

#language

#generativeAI

プロンプトに対するエキスパートの回答。たとえば、次のプロンプトがあるとします。

「名前を教えて」という質問を英語からフランス語に翻訳してください。

エキスパートの回答は次のようになります。

Comment vous appelez-vous?

さまざまな指標（ROUGE など）は、参照テキストが ML モデルの生成テキストと一致する度合いを測定します。

人間からのフィードバックを用いた強化学習（RLHF）

#generativeAI

#rl

人間のレーティングエージェントからのフィードバックを使用して、モデルの回答の品質を向上させる。たとえば、RLHF メカニズムでは、モデルのレスポンスの品質を 👍 または 👎 の絵文字で評価するようユーザーに求める場合があります。システムは、そのフィードバックに基づいて今後のレスポンスを調整できます。

ロールプロンプト

#language

#generativeAI

生成 AI モデルのレスポンスのターゲットオーディエンスを識別する、プロンプトのオプションの部分。ロールプロンプトがない場合、大規模言語モデルは、質問したユーザーにとって有用な回答とそうでない回答の両方を生成します。ロールプロンプトを使用すると、大規模言語モデルは、特定のターゲットユーザーにとってより適切で有用な方法で回答できます。たとえば、次のプロンプトのロールプロンプト部分は太字になっています。

このドキュメントを 経済学博士号取得者向けに要約してください。
潮汐の仕組みを10 歳の子どもに説明してください。
2008 年の金融危機について説明します。幼児やゴールデンレトリバーに話しかけるように話す。

S

ソフトプロンプトのチューニング

#language

#generativeAI

リソースを大量に消費するファインチューニングを行わずに、特定のタスク用に大規模言語モデルをチューニングする手法。ソフトプロンプトチューニングでは、モデル内のすべての重みを再トレーニングするのではなく、同じ目標を達成するためにプロンプトを自動的に調整します。

テキストプロンプトがある場合、通常、ソフトプロンプトチューニングでは、プロンプトに追加のトークンエンベディングを追加し、バックプロパゲーションを使用して入力を最適化します。

「ハード」なプロンプトには、トークンエンベディングではなく実際のトークンが含まれます。

T

温度

#language

#image

#generativeAI

モデルの出力のランダム性の度合いを制御するハイパーパラメータ。温度が高いほど、出力のランダム性が高くなります。温度が低いほど、出力のランダム性が低くなります。

最適な温度の選択は、特定のアプリケーションとモデルの出力の優先プロパティによって異なります。たとえば、クリエイティブな出力を生成するアプリケーションを作成する場合は、温度を上げます。逆に、画像やテキストを分類するモデルを作成する場合は、モデルの精度と一貫性を高めるために温度を下げる必要があります。

Temperature は、softmax と併用されることがよくあります。

Z

ゼロショットプロンプト

#language

#generativeAI

大規模言語モデルにどのように回答すればよいかを示す例を提供しないプロンプト。次に例を示します。

1 つのプロンプトの一部	メモ
`指定した国の公式通貨は何ですか？`	LLM に回答を求める質問。
`インド:`	実際のクエリ。

大規模言語モデルは、次のいずれかのレスポンスを返す場合があります。

ルピー
INR
₹
ルピー（インド）
ルピー
インドルピー

上記の選択肢はすべて正しいが、特定の形式が好ましい場合もある。

ゼロショットプロンプトと次の用語を比較します。

ワンショットプロンプト
少数ショットプロンプト

機械学習用語集: ジェネレーティブ AI コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

A

自動評価

自動評価

自己回帰モデル

C

Chain-of-Thought プロンプト

チャット

コンテキストに応じた言語エンベディング

コンテキスト ウィンドウ

D

直接プロンプト

での精製

E

evals

評価

F

事実性

少数ショット プロンプト

ファインチューニング

成功率

G

Gemini

Gemini モデル

生成されたテキスト

生成 AI

ゴールデン レスポンス

ゴールデン レスポンスと参照テキストに関する注記については、こちらをクリックしてください。

H

人間による評価

人間参加型（HITL）

I

コンテキスト内学習

指示チューニング

L

LLM

LLM 評価（evals）

LoRA

Low-Rank Adaptability（LoRA）

アイコンをクリックすると、LoRA のアップデート マトリックスの詳細を確認できます。

M

機械翻訳

K での平均適合率（mAP@k）

アイコンをクリックすると例が表示されます。

専門家集団

MMIT

モデル カスケード

モデルルーター

MOE

MT

N

正解なし（NORA）

NORA

O

ワンショット プロンプト

P

パラメータ効率チューニング

PLM

トレーニング後のモデル

事前トレーニング済みモデル

事前トレーニング

プロンプト

プロンプトベースの学習

プロンプト設計

プロンプト エンジニアリング

プロンプト チューニング

アイコンをクリックすると、接頭辞の詳細が表示されます。

R

参照テキスト

人間からのフィードバックを用いた強化学習（RLHF）

ロール プロンプト

S

ソフト プロンプトのチューニング

T

温度

Z

ゼロショット プロンプト

機械学習用語集: ジェネレーティブ AI

コンテキストウィンドウ

少数ショットプロンプト

ゴールデンレスポンス

ゴールデンレスポンスと参照テキストに関する注記については、こちらをクリックしてください。

アイコンをクリックすると、LoRA のアップデートマトリックスの詳細を確認できます。

モデルカスケード

ワンショットプロンプト

プロンプトエンジニアリング

プロンプトチューニング

ロールプロンプト

ソフトプロンプトのチューニング

ゼロショットプロンプト