一般化
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
一般化とは、モデルの作成に使用したものと同じ分布から抽出した、以前は見たことのない新しいデータに適切に適応することを指します。
一般化
全体の説明
- 目標: 実際の(隠れた)分布から得られた新しいデータについて、高い精度で予測する。
- 問題: 事実がわからない
全体の説明
- 目標: 実際の(隠れた)分布から得られた新しいデータについて、高い精度で予測する。
- 問題: 事実がわからない
- モデル h が現在のサンプルにうまく適合する場合、他の新しいサンプルでうまく予測できるかを信頼できる。
モデルが良いかどうかを知る方法
- 理論上、
- 興味深い分野: 一般化理論
- モデルのシンプルさ / 複雑度の測定に関するアイデアに基づく
- 直感: オッカムの「かみそり」の原則の定型化
- モデルが複雑すぎるほど、サンプルの特殊性だけでなく、優れた経験的結果が得られる可能性が高くなります。
モデルが良いかどうかを知る方法
- 経験的に:
- 尋ねる: モデルは新しいデータサンプルでうまく機能するか。
- 評価: テストセットに対するデータ呼び出しの新しいサンプルを取得します。
- テストセットのパフォーマンスが良好であることは、一般的に新しいデータのパフォーマンスが良好であることを示す指標となります。
- テストセットが十分に大きい場合
- テストセットを何度も使用してチートしなかった場合
ML ファインプリント
上記の 3 つの基本的な前提条件:
- 分布からランダムに独立して、同一(つまり)にサンプルを取得します。
- 分布は静止: 時間とともに変化しない
- トレーニング、検証、テストセットなど、常に同じディストリビューションから取得します。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2022-09-27 UTC。
[{
"type": "thumb-down",
"id": "missingTheInformationINeed",
"label":"必要な情報がない"
},{
"type": "thumb-down",
"id": "tooComplicatedTooManySteps",
"label":"複雑すぎる / 手順が多すぎる"
},{
"type": "thumb-down",
"id": "outOfDate",
"label":"最新ではない"
},{
"type": "thumb-down",
"id": "translationIssue",
"label":"翻訳に関する問題"
},{
"type": "thumb-down",
"id": "samplesCodeIssue",
"label":"サンプル / コードに問題がある"
},{
"type": "thumb-down",
"id": "otherDown",
"label":"その他"
}]
[{
"type": "thumb-up",
"id": "easyToUnderstand",
"label":"わかりやすい"
},{
"type": "thumb-up",
"id": "solvedMyProblem",
"label":"問題の解決に役立った"
},{
"type": "thumb-up",
"id": "otherUp",
"label":"その他"
}]