- 标签是指我们要预测的真实事物:y 基本线性回归中的 y 变量
- 特征是指用于描述数据的输入变量:xi 基本线性回归中的 {x1、x2、…xn} 变量
- 样本是指数据的特定实例:x 有标签样本具有 {特征, 标签}:(x, y) -->用于训练模型
- 无标签样本具有 {特征, ?}:(x, ?) -->用于对新数据做出预测
- 模型可将样本映射到预测标签:y' 由模型的内部参数定义,这些内部参数值是通过学习得到的
回归与分类 回归模型可预测连续值。例如,回归模型做出的预测可回答如下问题:
-
加利福尼亚州一栋房产的价值是多少?
-
用户点击此广告的概率是多少?
分类模型可预测离散值。例如,分类模型做出的预测可回答如下问题:
-
某个指定电子邮件是垃圾邮件还是非垃圾邮件?
-
这是一张狗、猫还是仓鼠图片?
- 合适的特征应该是具体且可量化的。