

数据科学与工程技术丛书 PYTHON机器学习PDF格式文档图书下载
- 购买点数:11 点
- 作 者:(美)塞巴斯蒂安·拉施卡(Sebastian Raschka)著 高明 徐莹 陶虎成译
- 出 版 社:北京:机械工业出版社
- 出版年份:2017
- ISBN:9787111558804
- 标注页数:259 页
- PDF页数:274 页
第1章 赋予计算机学习数据的能力 1
1.1 构建智能机器将数据转化为知识 1
1.2 机器学习的三种不同方法 1
1.2.1 通过监督学习对未来事件进行预测 2
1.2.2 通过强化学习解决交互式问题 4
1.2.3 通过无监督学习发现数据本身潜在的结构 4
1.2.4 基本术语及符号介绍 5
1.3 构建机器学习系统的蓝图 6
1.3.1 数据预处理 6
1.3.2 选择预测模型类型并进行训练 7
1.3.3 模型验证与使用未知数据进行预测 8
1.4 Python在机器学习中的应用 8
本章小结 9
第2章 机器学习分类算法 10
2.1 人造神经元——早期机器学习概览 10
2.2 使用Python实现感知器学习算法 13
2.3 自适应线性神经元及其学习的收敛性 19
2.3.1 通过梯度下降最小化代价函数 20
2.3.2 使用Python实现自适应线性神经元 21
2.3.3 大规模机器学习与随机梯度下降 25
本章小结 29
第3章 使用scikit-learn实现机器学习分类算法 30
3.1 分类算法的选择 30
3.2 初涉scikit-learn的使用 30
使用scikit-learn训练感知器 31
3.3 逻辑斯谛回归中的类别概率 34
3.3.1 初识逻辑斯谛回归与条件概率 34
3.3.2 通过逻辑斯谛回归模型的代价函数获得权重 36
3.3.3 使用scikit-learn训练逻辑斯谛回归模型 37
3.3.4 通过正则化解决过拟合问题 39
3.4 使用支持向量机最大化分类间隔 41
3.4.1 对分类间隔最大化的直观认识 41
3.4.2 使用松弛变量解决非线性可分问题 42
3.4.3 使用scikit-leam实现SVM 44
3.5 使用核SVM解决非线性问题 44
3.6 决策树 48
3.6.1 最大化信息增益——获知尽可能准确的结果 49
3.6.2 构建决策树 52
3.6.3 通过随机森林将弱分类器集成为强分类器 53
3.7 惰性学习算法——k-近邻算法 54
本章小结 57
第4章 数据预处理——构建好的训练数据集 58
4.1 缺失数据的处理 58
4.1.1 将存在缺失值的特征或样本删除 59
4.1.2 缺失数据填充 60
4.1.3 理解scikit-learn预估器的API 60
4.2 处理类别数据 61
4.2.1 有序特征的映射 61
4.2.2 类标的编码 62
4.2.3 标称特征上的独热编码 63
4.3 将数据集划分为训练数据集和测试数据集 64
4.4 将特征的值缩放到相同的区间 65
4.5 选择有意义的特征 66
4.5.1 使用L1正则化满足数据稀疏化 67
4.5.2 序列特征选择算法 70
4.6 通过随机森林判定特征的重要性 74
本章小结 76
第5章 通过降维压缩数据 77
5.1 无监督数据降维技术——主成分分析 77
5.1.1 总体方差与贡献方差 78
5.1.2 特征转换 80
5.1.3 使用scikit-learn进行主成分分析 82
5.2 通过线性判别分析压缩无监督数据 84
5.2.1 计算散布矩阵 85
5.2.2 在新特征子空间上选取线性判别算法 87
5.2.3 将样本映射到新的特征空间 89
5.2.4 使用scikit-learn进行LDA分析 90
5.3 使用核主成分分析进行非线性映射 91
5.3.1 核函数与核技巧 91
5.3.2 使用Python实现核主成分分析 94
5.3.3 映射新的数据点 99
5.3.4 scikit-learn中的核主成分分析 102
本章小结 103
第6章 模型评估与参数调优实战 104
6.1 基于流水线的工作流 104
6.1.1 加载威斯康星乳腺癌数据集 104
6.1.2 在流水线中集成数据转换及评估操作 105
6.2 使用k折交叉验证评估模型性能 106
6.2.1 holdout方法 106
6.2.2 k折交叉验证 107
6.3 通过学习及验证曲线来调试算法 110
6.3.1 使用学习曲线判定偏差和方差问题 110
6.3.2 通过验证曲线来判定过拟合与欠拟合 112
6.4 使用网格搜索调优机器学习模型 113
6.4.1 使用网络搜索调优超参 114
6.4.2 通过嵌套交叉验证选择算法 115
6.5 了解不同的性能评价指标 116
6.5.1 读取混淆矩阵 116
6.5.2 优化分类模型的准确率和召回率 117
6.5.3 绘制ROC曲线 118
6.5.4 多类别分类的评价标准 121
本章小结 121
第7章 集成学习——组合不同的模型 122
7.1 集成学习 122
7.2 实现一个简单的多数投票分类器 125
7.3 评估与调优集成分类器 131
7.4 bagging——通过bootstrap样本构建集成分类器 135
7.5 通过自适应boosting提高弱学习机的性能 138
本章小结 143
第8章 使用机器学习进行情感分析 144
8.1 获取IMDb电影评论数据集 144
8.2 词袋模型简介 146
8.2.1 将单词转换为特征向量 146
8.2.2 通过词频-逆文档频率计算单词关联度 147
8.2.3 清洗文本数据 148
8.2.4 标记文档 149
8.3 训练用于文档分类的逻辑斯谛回归模型 151
8.4 使用大数据——在线算法与外存学习 152
本章小结 155
第9章 在Web应用中嵌入机器学习模型 156
9.1 序列化通过scikit-learn拟合的模型 156
9.2 使用SQLite数据库存储数据 158
9.3 使用Flask开发Web应用 160
9.3.1 第一个Flask Web应用 160
9.3.2 表单验证及渲染 161
9.4 将电影分类器嵌入Web应用 164
9.5 在公共服务器上部署Web应用 169
本章小结 172
第10章 使用回归分析预测连续型目标变量 173
10.1 简单线性回归模型初探 173
10.2 波士顿房屋数据集 174
10.3 基于最小二乘法构建线性回归模型 178
10.3.1 通过梯度下降计算回归参数 178
10.3.2 使用scikit-learn估计回归模型的系数 181
10.4 使用RANSAC拟合高鲁棒性回归模型 182
10.5 线性回归模型性能的评估 184
10.6 回归中的正则化方法 185
10.7 线性回归模型的曲线化-多项式回归 186
10.7.1 房屋数据集中的非线性关系建模 188
10.7.2 使用随机森林处理非线性关系 190
本章小结 193
第11章 聚类分析——处理无类标数据 194
11.1 使用k-means算法对相似对象进行分组 194
11.1.1 k-means++ 196
11.1.2 硬聚类与软聚类 198
11.1.3 使用肘方法确定簇的最佳数量 199
11.1.4 通过轮廓图定量分析聚类质量 200
11.2 层次聚类 203
11.2.1 基于距离矩阵进行层次聚类 204
11.2.2 树状图与热度图的关联 207
11.2.3 通过scikit-learn进行凝聚聚类 208
11.3 使用DBSCAN划分高密度区域 209
本章小结 212
第12章 使用人工神经网络识别图像 213
12.1 使用人工神经网络对复杂函数建模 213
12.1.1 单层神经网络回顾 214
12.1.2 多层神经网络架构简介 215
12.1.3 通过正向传播构造神经网络 216
12.2 手写数字的识别 218
12.2.1 获取MNIST数据集 218
12.2.2 实现一个多层感知器 222
12.3 人工神经网络的训练 228
12.3.1 计算逻辑斯谛代价函数 228
12.3.2 通过反向传播训练神经网络 230
12.4 建立对反向传播的直观认识 231
12.5 通过梯度检验调试神经网络 232
12.6 神经网络的收敛性 236
12.7 其他神经网络架构 237
12.7.1 卷积神经网络 237
12.7.2 循环神经网络 238
12.8 关于神经网络的实现 239
本章小结 240
第13章 使用Theano并行训练神经网络 241
13.1 使用Theano构建、编译并运行表达式 241
13.1.1 什么是Theano 242
13.1.2 初探Theano 243
13.1.3 配置Theano 244
13.1.4 使用数组结构 245
13.1.5 整理思路——线性回归示例 247
13.2 为前馈神经网络选择激励函数 250
13.2.1 逻辑斯谛函数概述 250
13.2.2 通过softmax函数评估多类别分类任务中的类别概率 252
13.2.3 通过双曲正切函数增大输出范围 252
13.3 使用Keras提高训练神经网络的效率 254
本章小结 258
- 《数据科学与工程技术丛书 实用机器学习》(印)苏尼拉·格拉普蒂著;张世武,陈欣兵,商旦译 2018
- 《数据科学与工程技术丛书 PYTHON机器学习》(美)塞巴斯蒂安·拉施卡(Sebastian Raschka)著;高明,徐莹,陶虎成译 2017
- 《数据科学与工程技术丛书 计算机时代的统计推断 算法、演化和数据科学》(美)布拉德利·埃夫隆,(美)特雷福·黑斯蒂著 2019
- 《图灵程序设计丛书 Python数据科学与机器学习 从入门到实践》张海艳责任编辑;陈光欣译;(美)弗兰克·凯恩 2019
- 《数据科学与工程技术丛书 数据科学R语言实践 面向计算推理与问题求解的案例研究法》(美)德博拉·诺兰著;于戈译 2017
- 《智能系统与技术丛书 机器学习即服务 将Python机器学习创意快速转变为云端Web应用程序》(美)曼纽尔·阿米纳特吉,迈赫迪·洛佩伊著;刘世民,山金孝,史天,肖力译 2019
- 《信息安全技术丛书 数据驱动安全 数据安全分析、可视化和仪表盘》(美)雅克布,(美)鲁迪斯著 2015
- 《图灵程序设计丛书 Python数据科学入门》(俄)德米特里·齐诺维耶夫(Dmitry Zinoviev)著 2017
- 《“十二五”科学技术专著丛书 全方位陆地作业球形机器人》孙汉旭,于涛著 2015
- 《智能科学与技术丛书 统计强化学习 现代机器学习方法》(日)杉山将著;高阳等译 2019
- 《数据科学与工程技术丛书 PYTHON机器学习》(美)塞巴斯蒂安·拉施卡(Sebastian Raschka)著;高明,徐莹,陶虎成译 2017
- 《Python机器学习 第2版》(美)塞巴斯蒂安·拉施卡,瓦希德·米尔贾利利著 2019
- 《格林斯潘传》(美)塞巴斯蒂安·马拉比(Sebastian Mallaby)著 2019
- 《完美风暴》(美)塞巴斯蒂安·荣格尔(Sebastian Junger)著;赖慈芸译 2003
- 《概率机器人》(美)塞巴斯蒂安·特龙(Sebastian Thrun),(德)沃尔弗拉姆·比加尔(Wolfram Burgard),(美)迪特尔·福克斯(Dieter Fox)著 2017
- 《巴赫初级钢琴曲集》(德)约翰·塞巴斯蒂安·巴赫(Johann Sebastian Bach)作曲 2001
- 《最后消息 三幕剧》(罗)塞巴斯蒂安(M.Sebastian)著;石永礼译 1956
- 《巴赫名曲10首》(德)约翰·塞巴斯蒂安·巴赫(Johann Sebastian Bach)等作曲 ( )伯恩哈德·魏加特编订;陆群译 2005
- 《年轻十岁的秘密》(德)罗伯特·塞巴斯蒂安(Robert Sebastian)著;邵灵侠译 2003
- 《E大调小提琴协奏曲》约翰·塞巴斯蒂安·巴赫(Johamn Sebastian Bach)作曲 2009
- 《北京志 工业卷 机械工业志 农机工业志》北京市地方志编纂委员会编 2001
- 《机械工业和机械图书的出版发行 机械工业出版社发行培训教材》陈慧毅,杨少晨编 1988
- 《冷冲模设计》赵孟栋主编 2006
- 《机械工业出版社》慕拉维叶夫著;孔庆复译 1959
- 《北京市立高级工业职业学校机械科毕业学生韩丕纯分数表/韩丕纯毕业证书》 1949
- 《中等职业教育机电类规划教材 机械工业出版社精品教材 机械设计基础 第2版》机械职业教育基础课教学指导委员会机械设计学科组组编;柴鹏飞主编 2006
- 《集知播识春秋录 机械工业出版社 1952-1988.机械科学技术情报研究所 1958-1988》机械科技情报研究所,机械工业出版社编 1988
- 《电线电缆》上海市电缆研究所编 1975
- 《FoxBASE+ 三周通》文忠等编著 1995
- 《FoxBASE+实验指导书》李爱华,王建诚编 1994