当前位置:首页 > 工业技术
计算机科学丛书  统计推荐系统

计算机科学丛书 统计推荐系统PDF格式文档图书下载

工业技术

图书介绍

第一部分 基础知识 2

第1章 简介 2

1.1 面向网络应用的推荐系统概述 3

1.1.1 算法 3

1.1.2 优化指标 5

1.1.3 探索与利用之间的权衡 5

1.1.4 推荐系统的评估 5

1.1.5 推荐和搜索:推送与拉取 6

1.2 一个简单的评分模型:热门推荐 7

1.3 练习 10

第2章 经典推荐方法 11

2.1 物品特征 11

2.1.1 分类 12

2.1.2 词袋模型 13

2.1.3 主题建模 15

2.1.4 其他物品特征 16

2.2 用户特征 16

2.2.1 声明的个人信息 17

2.2.2 基于内容的画像 17

2.2.3 其他用户特征 18

2.3 基于特征的方法 18

2.3.1 无监督方法 18

2.3.2 有监督方法 19

2.3.3 上下文信息 22

2.4 协同过滤 22

2.4.1 基于用户-用户相似度的方法 23

2.4.2 基于物品-物品相似度的方法 24

2.4.3 矩阵分解 24

2.5 混合方法 27

2.6 小结 28

2.7 练习 28

第3章 面向推荐问题的探索与利用 29

3.1 探索与利用之间的权衡简介 30

3.2 多臂赌博机问题 31

3.2.1 贝叶斯方法 31

3.2.2 极小化极大方法 34

3.2.3 启发式赌博方案 35

3.2.4 方法评价 36

3.3 推荐系统中的探索与利用 36

3.3.1 热门推荐 36

3.3.2 个性化推荐 36

3.3.3 数据稀疏性的挑战 37

3.4 处理数据稀疏性的探索与利用 37

3.4.1 降维方法 37

3.4.2 降维中的探索与利用 39

3.4.3 在线模型 39

3.5 小结 40

3.6 练习 40

第4章 评估方法 41

4.1 传统的离线评估方法 41

4.1.1 数据划分方法 42

4.1.2 准确度指标 44

4.1.3 排序指标 45

4.2 在线分桶测试 49

4.2.1 设置分桶测试 49

4.2.2 在线性能指标 50

4.2.3 测试结果分析 51

4.3 离线模拟 52

4.4 离线回放 54

4.4.1 基本回放估计 55

4.4.2 回放的扩展 57

4.5 小结 58

4.6 练习 58

第二部分 常见问题设置 60

第5章 问题设置与系统架构 60

5.1 问题设置 60

5.1.1 常见的推荐模块 60

5.1.2 应用设置 63

5.1.3 常见的统计方法 65

5.2 系统架构 66

5.2.1 主要组件 66

5.2.2 示例系统 67

第6章 热门推荐 69

6.1 应用案例:雅虎“今日”模块 69

6.2 问题定义 71

6.3 贝叶斯方案 72

6.3.1 2×2案例:两件物品,两个间隔 73

6.3.2 K×2案例:K件物品,两个间隔 75

6.3.3 一般解 77

6.4 非贝叶斯方案 79

6.5 实验评估 81

6.5.1 比较分析 81

6.5.2 方案刻画 83

6.5.3 分段分析 85

6.5.4 桶测试结果 86

6.6 大规模内容池 87

6.7 小结 87

6.8 练习 88

第7章 基于特征回归的个性化 89

7.1 快速在线双线性因子模型 90

7.1.1 FOBFM概述 90

7.1.2 FOBFM详解 91

7.2 离线训练 93

7.2.1 EM算法 94

7.2.2 E步骤 95

7.2.3 M步骤 96

7.2.4 可扩展性 97

7.3 在线学习 97

7.3.1 在线高斯模型 97

7.3.2 在线逻辑模型 98

7.3.3 探索与利用方案 99

7.3.4 在线模型选择 99

7.4 雅虎数据集上的效果展示 100

7.4.1 My Yahoo!数据集 101

7.4.2 雅虎首页数据集 103

7.4.3 不包含离线双线性项的FOBFM 105

7.5 小结 105

7.6 练习 106

第8章 基于因子模型的个性化 107

8.1 面向回归的隐因子模型 107

8.1.1 从矩阵分解到RLFM 108

8.1.2 模型详解 109

8.1.3 RLFM的随机过程 112

8.2 拟合算法 113

8.2.1 适用于高斯响应的EM算法 114

8.2.2 适用于逻辑响应的基于ARS的EM算法 118

8.2.3 适用于逻辑响应的变分EM算法 121

8.3 冷启动效果展示 124

8.4 时间敏感物品的大规模推荐 127

8.4.1 在线学习 127

8.4.2 并行拟合算法 128

8.5 大规模问题效果展示 130

8.5.1 MovieLens-1M数据 131

8.5.2 小规模雅虎首页数据 132

8.5.3 大规模雅虎首页数据 134

8.5.4 结果讨论 137

8.6 小结 138

8.7 练习 138

第三部分 进阶主题 140

第9章 基于隐含狄利克雷分布的分解 140

9.1 简介 140

9.2 模型 141

9.2.1 模型概述 141

9.2.2 模型详解 142

9.3 训练和预测 145

9.3.1 模型拟合 145

9.3.2 预测 150

9.4 实验 150

9.4.1 MovieLens数据 150

9.4.2 Yahoo!Buzz应用 151

9.4.3 BookCrossing数据集 153

9.5 相关工作 154

9.6 小结 155

第10章 上下文相关推荐 156

10.1 张量分解模型 157

10.1.1 建模 157

10.1.2 模型拟合 158

10.1.3 讨论 159

10.2 层次收缩模型 160

10.2.1 建模 160

10.2.2 模型拟合 161

10.2.3 局部增强张量模型 164

10.3 多角度新闻文章推荐 165

10.3.1 探索性数据分析 166

10.3.2 实验评估 171

10.4 相关物品推荐 176

10.4.1 语义相关性 177

10.4.2 响应预测 177

10.4.3 预测响应和预测相关性的结合 178

10.5 小结 178

第11章 多目标优化 179

11.1 应用设置 179

11.2 分段方法 180

11.2.1 问题设置 180

11.2.2 目标优化 181

11.3 个性化方法 183

11.3.1 原始表示 184

11.3.2 拉格朗日对偶 185

11.4 近似方法 188

11.4.1 聚类 188

11.4.2 采样 189

11.5 实验 189

11.5.1 实验设置 190

11.5.2 实验结果 191

11.6 相关工作 197

11.7 小结 198

参考文献 199

索引 205

查看更多关于计算机科学丛书 统计推荐系统的内容

相关书籍
作者其它书籍
返回顶部