统计学习基础（译注）

The Elements of Statistical Learning¹: 亚马逊豆瓣

这本书我断断续续地读了两年多，支离破碎，看一点忘一点。我正好计划趁着今年夏歇之际系统地读一遍，然而到了立秋才开始。在豆瓣上看到对此书翻译版略有微辞，于是我有了边读边整理中文版本的想法。之前有一些前辈提供了一些中文笔记，但可惜没有完成，确实这本书又厚又专业，翻译的工作量很大。我也不确定我是否能完成，只希望借此可以督促自己学习，如果碰巧对书友们有所帮助，纯属巧合。

我购买的是世界图书出版公司的影印版，印刷质量尚可，但版本老旧。另外也在参考作者放出的电子版第12版。

文章目录

原则

如果有对应中文名称，则使用中文。优先采用已经出现的译法。如果尚无通用译法，或已有译法存在歧义，则尝试给出新译法。专业词汇的中英对照罗列于这个链接中。
中英文的行文逻辑不同，有时直译会难以理解，所以不可避免会有个人的意译转述。
另外，在原文基础上，我在个人觉得费解处也加入了额外的脚注。
文中出现的人名不翻译。
对于专业术语的中译，主要参考了：
- 西瓜书：周志华 (2016)²。
- 维基百科：一些英文页面已有中文对照。

大纲

目录索引

“统计学习基础”（ESL）一书的章节目录索引，随完成进度更新。
术语对照

“统计学习基础”（ESL）一书中的专业术语的中英文对照，随完成进度更新。
1 序言

第 1-8 页。对本书内容概括性地介绍，几个实际应用的例子，章节的逻辑结构，等等。
2 监督学习概述

第 9-42 页。
3 线性回归方法

第 43-100 页。线性方法简单而有效，而且是很多非线性方法的基础。
4 线性分类方法

第 101-138 页。分类模型可被理解为将输入变量空间划分为不同的区域，每个区域会被赋予一个预测的类别。“线性”指的是这些区域的决策边界是线性的（直线或平面），或经过某些单调变换后呈线性。如果在经过扩展后的输入变量空间上构建线性决策边界，还原到原始空间上则可得到非线性的决策边界。
5 基拓展和正则化

第 139-190 页。第五章为基拓展及其正则化方法，进入非线性方法的范畴。
6 核平滑方法

第 191-218 页。一个局部化的方法是在待拟合或预测的输入点处用邻域的样本点建模，而其局部化是通过权重函数，或成为核函数，来实现的。
7 模型评估和选择

第 219-260 页。
8 模型的推断和平均

第 261-294 页。本章阐述了最大似然法和贝叶斯方法下的推断。
9 加性模型和树模型

第 295-336 页。
10 提升方法

第 337-388 页。提升方法在迭代过程中不断地调整样本的权重，提高拟合差的样本对基模型的影响力，再将所得到的一系列基模型的加权投票作为最终结果。本节以自适应提升为例演示了提升方法的效果。
11 神经网络

第 389-416 页。
12 支持向量机和灵活判别

第 417-458 页。
13 原型方法和最近邻

第 459-484 页。
14 无监督学习

第 485-586 页。
15 随机森林

第 587-604 页。
16 集成学习

第 605-624 页。
17 无向图模型

第 625-648 页。
18 高维问题：p ≫ N

第 649-698 页。

参考资料

Hastie, T., Tibshirani, R., and Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition, Springer, New York.
周志华. 2016. 机器学习. 清华大学出版社.

练习

Weatherwax and Epstein (2021) [pdf]

更新

2018-10-23

搜索某个术语的时候，偶然落到了一个网页上，发现 Wei Ya 已经完成了整本书的翻译（链接）。

本想放弃这个版本，转向校对 Wei Ya 的版本，但几天的实验发现缺少了原有的读书动力。这个翻译计划对我自己的促进才是其根本的意义。故我会继续进行下去，同时也会参考和校对 Wei Ya 的版本。

Hastie, T., Tibshirani, R., and Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition, Springer, New York. ↩︎
周志华. 2016. 机器学习. 清华大学出版社. ↩︎