以下の選択肢をご確認ください。

特定のメールが「迷惑メール」なのか「迷惑メールではない」かを予測するために、教師あり機械学習モデルを開発する必要があるとします。次の説明のうち正しいものはどれですか。
「迷惑メール」または「迷惑メールではない」とマークされていないメールは、ラベルの付いていない項目です。
Google のラベルは「スパム」と「迷惑メールではない」という値で構成されているため、まだ迷惑メールとしてマークされていないメールもラベルが付いていないメールです。
件名のヘッダーに含まれる単語により適切なラベルが付けられます。
サブジェクト ヘッダー内の単語は優れた機能を持つ可能性がありますが、適切なラベルを作成できません。
ラベルのないサンプルを使用してモデルをトレーニングします。
ラベル付きの例を使用してモデルをトレーニングします。次に、ラベルのないサンプルに対してトレーニング済みのモデルを実行し、ラベルのないメール メッセージがスパムかどうかを判断できます。
一部の例に適用されたラベルは、信頼性が低い場合があります。
もちろん。データの信頼性を確認することは重要です。このデータセットのラベルは、多くの場合、特定のメール メッセージを迷惑メールに分類するメールユーザーに由来します。ほとんどのユーザーは、不審なメールをすべて迷惑メールに分類しないため、迷惑メールであるかどうかを判断できないことがあります。さらに、スパマーは欠陥のあるラベルを提供することで、意図的にモデルに悪影響を及ぼす可能性があります。