一、文献综述
(一)国内外研究现状
互联网的发展给了推荐系统兴起和发展的肥沃土壤。1994年,明尼苏达大学双城分校计算机系的 GroupLens 研究组设计了名为 GroupLens 的新闻推荐系统。协同过滤的思想首次被提出,该项目建立了一个形式化的模型以供将来的推荐问题可以参考,为之后二十余年间推荐系统的发展带来了巨大的改变和深厚影响。目前仍在使用的 MovieLens 推荐网站也是由该项目组建立而成,该网站是一个推荐引擎的学术研究平台,其中包含着迄今为止推荐领域引用量最大的数据集。
在2010年之前,推荐系统领域占主导地位的是协同过滤、矩阵分解和逻辑回归等传统推荐算法。在这之后近深度学习模型也开始出现,如因子分解机、梯度提升决策树等。2015年深度学习时代,深度学习推荐模型受到广泛应用,其中有根据用户历史行为生成用户-物品共现矩阵和利用用户之间和物品之间的相似性来进行推荐的CF算法。其中还有LR算法,它的原理是将推荐问题通过转化,变为分类问题。另外还有表达能力更好,能过抓取组合特征的FM算法。尽管这三类算法已经得到广泛应用,但是算法本身还是具有处理稀疏数据的能力差,融合其他属性的能力弱等比较明显的缺点。
在后续的研究中,还出现了很多优秀的推荐算法,比如NCF算法,它改进了了基础的协同过滤算法,将矩阵分解中用户向量和物品向量间的点积操作用神经网络代替,加强了矩阵分解的表达能力;也有NFM模型,它是将FM因子分解机的二阶隐向量交叉操作换为用神经网络代替,与FM模型相比起来表达能力和特征交叉能力都更优秀;DeepFM模型将用FM来替换线性的Wide部分以此增强Wide部分的特征组合学习能力;还有引入时间信号的序列建模,让模型考虑了与时间相关的用户行为序列中的有效信息,增强了系统对用户兴趣迁移的学习能力。在强化学习方面,DRN模型可以对推荐模型进行线上实时学习,大大增强了模型利用实时性数据的效率。上述方法也依然存在一些缺点,它们多依赖深度学习进行建模,这就使得要在工程上实现是比较困难的。
- 研究主要成果
(1)基于流行度的推荐算法
基于流行度的推荐算法是对热点商品或者信息的推荐。它主要是根据PV、UV、日均PV或分享率等数据来按某种热度排序来推荐给用户。这种算法的优点是简单便捷,易于使用,能够解决对新用户推荐的冷启动问题。它的缺点则是无法给用户提供个性化的推荐。
(2)基于内容的推荐算法
基于内容的推荐是在推荐引擎出现之初应用最为广泛的推荐机制,它的核心思想是根据推荐物品或内容的元数据,发现物品或者内容的相关性,然后基于用户以往的喜好记录,推荐给用户相似的物品。这种推荐系统多用于一些资讯类的应用上,针对文章、电影或音乐本身抽取一些标签作为该其关键词,继而可以通过这些标签来评价两者的相似度。
这种推荐系统的优点是易于实现,不需要用户数据因此不存在稀疏性和冷启动问题。其次,算法是基于物品本身特征推荐,因此不存在过度推荐热门的问题。其缺点也是显而易见的,推荐的物品可能会重复,并且对抽取的标签特征有很大要求,否则很难保证推荐结果的准确性。
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。