#推荐系统 此 Repository 主要是自己在学习推荐系统的过程中,为了加深对算法的理解自己动手手写算法,其中包括了很多经典的模型及其改进形式。
本章主要实现基于内容的推荐系统所需要的基本算法。
这些算法可以根据用户行为提取结构化数据,然后选择标签
- 关键字提取——TF-IDF(√)和TextRank(√)
- 内容分类——FastText(√)
- 实体识别——BiLSTM-CRF
- 单词嵌入——Word2Vec(√)
从结构化数据中提取的过滤器标签
- 卡方
- 信息熵
本章主要实现了基于协同过滤的推荐系统的基本算法。
协同过滤包括基于内存的 CF 和基于模型的 CF 。
这里主要介绍了基于内存的 CF。
- 基于用户的协同过滤——Usercf(√)
- 基于项目的协同过滤——Itemcf(√)
本章主要实现了基于矩阵分解的推荐系统的基本算法。
最常见的矩阵分解是 RSVD。
许多公司也使用ALS和BPR来优化矩阵分解。
- 正则奇异值分解——RSVD(√)
- 贝叶斯个性化排名——BPR(√)
本章主要实现了基于模型集成的推荐系统的基本算法。
典型的模型方案为 GBDT+LR。
- 梯度 Boost 决策树与Logistic回归——GDBT+LR(√)
- 因子分解机——FM
- Wide & Deep