训练集和测试集 (Training and Test Sets)

测试集是用于评估根据训练集开发的模型的数据集。

训练集和测试集

数据拆分为两类:较大规模的训练数据集和较小规模的测试数据集
两个模型:一个针对训练数据运行,另一个针对测试数据运行。该模型非常简单,只是一条将橙点与蓝点分开的线。训练数据的损失与测试数据的损失相似。
  • 分成两个数据集:
    • 训练集
    • 测试集
  • 典型陷阱:请勿对测试数据进行训练
    • 损失低得令人惊讶?
    • 在庆祝之前,请检查您是否不小心对测试数据进行了训练