实现模型

实现模型时,请从简单开始。机器学习中的大部分工作都在数据端完成,因此,让复杂模型的完整流水线正常运行比迭代模型本身更难。设置数据流水线并实现使用少量特征的简单模型后,您可以迭代创建更好的模型。

简单的模型可以提供良好的基准,即使您最终未发布这些模型也是如此。事实上,使用简单模型的效果可能比您想象的要好。从简单开始有助于您确定复杂模型是否有必要。

训练自己的模型与使用已训练的模型

训练好的模型适用于各种用例,并具有许多优势。不过,只有当标签和特征与您的数据集完全匹配时,训练好的模型才会真正发挥作用。例如,如果训练好的模型使用了 25 个特征,而您的数据集仅包含其中 24 个,那么训练好的模型很可能会做出错误的预测。

通常,机器学习从业者会使用训练模型中匹配的输入子部分进行微调或迁移学习。如果不存在适用于您的特定用例的训练模型,请考虑在训练自己的模型时使用训练好的模型的子部分。

如需了解训练好的模型,请参阅

监控

在构建问题框架时,请考虑您的机器学习解决方案需要的监控和提醒基础架构。

模型部署

在某些情况下,新训练的模型的效果可能会不如当前在生产环境中使用的模型。如果是,您需要阻止其发布到生产环境,并收到自动部署失败的提醒。

训练-应用偏差

如果用于推理的任何传入特征的值超出了训练中所用数据的分布范围,您需要收到提醒,因为模型可能会做出不准确的预测。例如,如果您的模型经过训练可预测海平面上赤道城市的温度,那么您的服务系统应在有纬度、经度和/或海拔超出模型训练范围的传入数据时提醒您。反之,如果模型的预测结果超出了训练期间出现的分布范围,服务系统应向您发出提醒。

推理服务器

如果您通过 RPC 系统提供推理,则需要监控 RPC 服务器本身,并在 RPC 服务器停止提供推理时收到提醒。