问题构建 (Framing)

本单元探讨了如何将某个任务构建为机器学习问题,并介绍了各种机器学习方法中通用的很多基本词汇术语。

问题构建

机器学习系统

通过学习如何组合输入信息

来对从未见过的数据

做出有用的预测

  • 标签是指我们要预测的真实事物:y
    • 基本线性回归中的 y 变量
  • 标签是指我们要预测的真实事物:y
    • 基本线性回归中的 y 变量
  • 特征是指用于描述数据的输入变量:xi
    • 基本线性回归中的 {x1、x2、…xn} 变量
  • 样本是指数据的特定实例:x
  • 有标签样本具有 {特征, 标签}:(x, y)
    • 用于训练模型
  • 无标签样本具有 {特征, ?}:(x, ?)
    • 用于对新数据做出预测
  • 样本是指数据的特定实例:x
  • 有标签样本具有 {特征, 标签}:(x, y)
    • 用于训练模型
  • 无标签样本具有 {特征, ?}:(x, ?)
    • 用于对新数据做出预测
  • 模型可将样本映射到预测标签:y'
    • 由模型的内部参数定义,这些内部参数值是通过学习得到的