用一个简单的例子可以帮助理解本章之前已介绍的各种模型和方法。假设有两个输入变量

图 3.18 展示了不同模型的系数估计值随着调节参数的变化曲线。上图为
值得注意的是不同方法的收缩方式的区别。岭回归在所有的方向上收缩,在样本方差低的方向上收缩程度更大。主成分回归只保留 M 个高方差的方向,直接舍弃掉其他的方向。而部分最小二乘不仅倾向于在低方差的方向上收缩,实际上还会在高方差的方向上放大。这种性质使部分最小二乘有一点不稳定,比岭回归的预测误差稍高。详细的研究可见(Frank and Friedman, 1993),论文的作者认为就最小而预测误差方面,岭回归通常是比变量子集选择、主成分回归、和部分最小二乘更好的选择,但对后两者的优势微乎其微。
综上,部分最小二乘、主成分回归和岭回归的表现相似。应用中可能倾向于岭回归,因为其平滑的收缩性质,不存在跳跃。套索回归介于岭回归和最优子集选择之间,同时包含了两者的部分性质。