ショットの構図: 理解度をチェック

教師ありの学習

以下の選択肢をご確認ください。

特定のメールが「迷惑メール」なのか「迷惑メールではない」かを予測するために、教師あり機械学習モデルを開発する必要があるとします。次の説明のうち正しいものはどれですか。
「迷惑メール」または「迷惑メールではない」とマークされていないメールは、ラベルの付いていない項目です。
Google のラベルは「スパム」と「迷惑メールではない」という値で構成されているため、まだ迷惑メールとしてマークされていないメールもラベルが付いていないメールです。
件名のヘッダーに含まれる単語により適切なラベルが付けられます。
サブジェクト ヘッダー内の単語は優れた機能を持つ可能性がありますが、適切なラベルを作成できません。
ラベルのないサンプルを使用してモデルをトレーニングします。
ラベル付きの例を使用してモデルをトレーニングします。次に、ラベルのないサンプルに対してトレーニング済みのモデルを実行し、ラベルのないメール メッセージがスパムかどうかを判断できます。
一部の例に適用されたラベルは、信頼性が低い場合があります。
もちろん。データの信頼性を確認することは重要です。このデータセットのラベルは、多くの場合、特定のメール メッセージを迷惑メールに分類するメールユーザーに由来します。ほとんどのユーザーは、不審なメールをすべて迷惑メールに分類しないため、迷惑メールであるかどうかを判断できないことがあります。さらに、スパマーは欠陥のあるラベルを提供することで、意図的にモデルに悪影響を及ぼす可能性があります。

機能とラベル

以下の選択肢をご確認ください。

オンラインの靴店で、パーソナライズされた靴のおすすめ情報をユーザーに提供する教師あり ML モデルを作成するとします。つまり、このモデルは特定の靴を Marty に推奨し、別の靴を Janet に推奨します。システムは過去のユーザー行動データを使用してトレーニング データを生成します。次の説明のうち正しいものはどれですか。
「靴のサイズ」は便利な機能です。
「靴のサイズ」は、ユーザーがおすすめの靴を好むかどうかに大きな影響を与える可能性が高い定量化のシグナルです。たとえば、マーティがサイズ 9 を着用している場合、モデルではサイズ 7 の靴をおすすめしません。
「靴の美容」は便利な機能です。
良い特徴は具体的で定量化できます。美容という概念はもはや曖昧で、役に立つ機能として扱えません。 美容は、スタイルや色などの具体的な特長を組み合わせたものです。美しさよりもスタイルや色が優れた特徴となります。
「ユーザーが靴の説明文をクリック」は便利なラベルです。
ユーザーは、好きな靴についてもっと読みたいと思っています。したがって、ユーザーによるクリックは、適切なトレーニング ラベルとして使用できる測定可能な指標です。トレーニング データは過去のユーザー行動から派生するため、ラベルはユーザーの好みに強く相関するクリックなどの客観的な行動から派生する必要があります。
"ユーザーが愛用している靴は有用なラベル。
勧誘は、測定可能な定量化できない指標です。最も可能なのは、観察可能なプロキシ指標を探すことです。