Skip to content

Latest commit

 

History

History
34 lines (23 loc) · 1.07 KB

01框架处理.md

File metadata and controls

34 lines (23 loc) · 1.07 KB

术语:标签和特征

  • 标签是指我们要预测的真实事物:y 基本线性回归中的 y 变量
  • 特征是指用于描述数据的输入变量:xi 基本线性回归中的 {x1、x2、…xn} 变量

术语:样本和模型

  • 样本是指数据的特定实例:x 有标签样本具有 {特征, 标签}:(x, y) -->用于训练模型
  • 无标签样本具有 {特征, ?}:(x, ?) -->用于对新数据做出预测
  • 模型可将样本映射到预测标签:y' 由模型的内部参数定义,这些内部参数值是通过学习得到的

回归与分类

回归与分类 回归模型可预测连续值。例如,回归模型做出的预测可回答如下问题:

  • 加利福尼亚州一栋房产的价值是多少?

  • 用户点击此广告的概率是多少?

分类模型可预测离散值。例如,分类模型做出的预测可回答如下问题:

  • 某个指定电子邮件是垃圾邮件还是非垃圾邮件?

  • 这是一张狗、猫还是仓鼠图片?

总结:

  • 合适的特征应该是具体且可量化的。