数据集、泛化和过拟合:测试您的知识

  1. 以下哪一项是静态数据集的示例?

  2. 您正准备使用包含以下特征的数据集训练一个用于预测二手车售价的模型:yearmodelmileage。在检查数据集时,您发现 2500 个样本中有 150 个缺少里程值。以下哪些选项是合理的做法?(请选择所有适用选项)

    选择合适的多项回答。

  3. 您正在训练在线播放服务的电影推荐模型,以预测用户对给定电影的情绪。以下哪些标签可以合理地作为“用户喜欢这部电影”的代理标签?(请选择所有适用选项)

    选择合适的多项回答。

  4. 判断对错:训练模型,直到在测试数据上达到较低的损失值,是防止过拟合的好方法。

  5. 请在下面的空白处填入适当的内容:
    正则化会在训练期间惩罚 ___,从而提高模型泛化到新数据的能力。