logo
分类于: 其它 编程语言

简介

统计推荐系统

统计推荐系统 0.0分

资源最后更新于 2020-10-22 22:41:09

作者:Deepak K. Agarwal

译者:戴薇

出版社:机械工业出版社

出版日期:2019-01

ISBN:9787111635734

文件格式: pdf

标签: 机器学习 推荐系统 美国 2019

简介· · · · · ·

推荐系统无处不在,已经成为我们日常生活的一部分。本书由LinkedIn公司的两位技术专家撰写,着眼于推荐系统的核心——统计方法,不仅介绍算法理论,而且包含实验分析及结果展示,分享了作者丰富的实战经验。

书中对推荐系统进行了全面讨论,特别是面向日益突显的多反馈和多目标优化问题,深入分析了当前先进的统计方法,如自适应序贯设计(多臂赌博机方法)、双线性随机效应模型(矩阵分解)以及基于MapReduce分布式框架的可伸缩模型,为热门推荐和个性化推荐提供了实用的解决方案。全书将基于回归的响应预测方法作为主要工具,兼顾实验设计和统计模型开发,关注探索和利用之间的权衡。

直接下载

想要: 点击会收藏到你的 我的收藏,可以在这里查看

已收: 表示已经收藏

Tips: 注册一个用户 可以通过用户中心得到电子书更新的通知哦

目录

出版者的话
译者序
前言
第一部分 基础知识
第1章 简介2
1.1 面向网络应用的推荐系统概述3
1.1.1 算法3
1.1.2 优化指标5
1.1.3 探索与利用之间的权衡5
1.1.4 推荐系统的评估5
1.1.5 推荐和搜索:推送与拉取6
1.2 一个简单的评分模型:热门推荐7
1.3 练习10
第2章 经典推荐方法11
2.1 物品特征11
2.1.1 分类12
2.1.2 词袋模型13
2.1.3 主题建模15
2.1.4 其他物品特征16
2.2 用户特征16
2.2.1 声明的个人信息17
2.2.2 基于内容的画像17
2.2.3 其他用户特征18
2.3 基于特征的方法18
2.3.1 无监督方法18
2.3.2 有监督方法19
2.3.3 上下文信息22
2.4 协同过滤22
2.4.1 基于用户-用户相似度的方法23
2.4.2 基于物品-物品相似度的方法24
2.4.3 矩阵分解24
2.5 混合方法27
2.6 小结28
2.7 练习28
第3章 面向推荐问题的探索与利用29
3.1 探索与利用之间的权衡简介30
3.2 多臂赌博机问题31
3.2.1 贝叶斯方法31
3.2.2 极小化极大方法34
3.2.3 启发式赌博方案35
3.2.4 方法评价36
3.3 推荐系统中的探索与利用36
3.3.1 热门推荐36
3.3.2 个性化推荐36
3.3.3 数据稀疏性的挑战37
3.4 处理数据稀疏性的探索与利用37
3.4.1 降维方法37
3.4.2 降维中的探索与利用39
3.4.3 在线模型39
3.5 小结40
3.6 练习40
第4章 评估方法41
4.1 传统的离线评估方法41
4.1.1 数据划分方法42
4.1.2 准确度指标44
4.1.3 排序指标45
4.2 在线分桶测试49
4.2.1 设置分桶测试49
4.2.2 在线性能指标50
4.2.3 测试结果分析51
4.3 离线模拟52
4.4 离线回放54
4.4.1 基本回放估计55
4.4.2 回放的扩展57
4.5 小结58
4.6 练习58
第二部分 常见问题设置
第5章 问题设置与系统架构60
5.1 问题设置60
5.1.1 常见的推荐模块60
5.1.2 应用设置63
5.1.3 常见的统计方法65
5.2 系统架构66
5.2.1 主要组件66
5.2.2 示例系统67
第6章 热门推荐69
6.1 应用案例:雅虎“今日”模块69
6.2 问题定义71
6.3 贝叶斯方案72
6.3.1 2×2案例:两件物品,两个间隔73
6.3.2 K×2案例:K件物品,两个间隔75
6.3.3 一般解77
6.4 非贝叶斯方案79
6.5 实验评估81
6.5.1 比较分析81
6.5.2 方案刻画83
6.5.3 分段分析85
6.5.4 桶测试结果86
6.6 大规模内容池87
6.7 小结87
6.8 练习88
第7章 基于特征回归的个性化89
7.1 快速在线双线性因子模型90
7.1.1 FOBFM概述90
7.1.2 FOBFM详解91
7.2 离线训练93
7.2.1 EM算法94
7.2.2 E步骤95
7.2.3 M步骤96
7.2.4 可扩展性97
7.3 在线学习97
7.3.1 在线高斯模型97
7.3.2 在线逻辑模型98
7.3.3 探索与利用方案99
7.3.4 在线模型选择99
7.4 雅虎数据集上的效果展示100
7.4.1 My Yahoo!数据集101
7.4.2 雅虎首页数据集103
7.4.3 不包含离线双线性项的FOBFM105
7.5 小结105
7.6 练习106
第8章 基于因子模型的个性化107
8.1 面向回归的隐因子模型107
8.1.1 从矩阵分解到RLFM108
8.1.2 模型详解109
8.1.3 RLFM的随机过程112
8.2 拟合算法113
8.2.1 适用于高斯响应的EM算法114
8.2.2 适用于逻辑响应的基于ARS的EM算法118
8.2.3 适用于逻辑响应的变分EM算法121
8.3 冷启动效果展示124
8.4 时间敏感物品的大规模推荐127
8.4.1 在线学习127
8.4.2 并行拟合算法128
8.5 大规模问题效果展示130
8.5.1  MovieLens-1M数据131
8.5.2 小规模雅虎首页数据132
8.5.3 大规模雅虎首页数据134
8.5.4 结果讨论137
8.6 小结138
8.7 练习138
第三部分 进阶主题
第9章 基于隐含狄利克雷分布的分解140
9.1 简介140
9.2 模型141
9.2.1 模型概述141
9.2.2 模型详解142
9.3 训练和预测145
9.3.1 模型拟合145
9.3.2 预测150
9.4 实验150
9.4.1 MovieLens数据150
9.4.2 Yahoo! Buzz应用151
9.4.3 BookCrossing数据集153
9.5 相关工作154
9.6 小结155
第10章 上下文相关推荐156
10.1 张量分解模型157
10.1.1 建模157
10.1.2 模型拟合158
10.1.3 讨论159
10.2 层次收缩模型160
10.2.1 建模160
10.2.2 模型拟合161
10.2.3 局部增强张量模型164
10.3 多角度新闻文章推荐165
10.3.1 探索性数据分析166
10.3.2 实验评估171
10.4 相关物品推荐176
10.4.1 语义相关性177
10.4.2 响应预测177
10.4.3 预测响应和预测相关性的结合178
10.5 小结178
第11章 多目标优化179
11.1 应用设置179
11.2 分段方法180
11.2.1 问题设置180
11.2.2 目标优化181
11.3 个性化方法183
11.3.1 原始表示184
11.3.2 拉格朗日对偶185
11.4 近似方法188
11.4.1 聚类188
11.4.2 采样189
11.5 实验189
11.5.1 实验设置190
11.5.2 实验结果191
11.6 相关工作197
11.7 小结198
参考文献199
索引205