西瓜书day24

主成分分析(PCA)

PCA是一种最常用的降维方法

  • 最近重构性:样本点到这个超平面的距离都足够近
  • 最大可分性:样本点在这个超平面上的投影能尽可能分开

最近重构性

最大可分性

应用拉格朗日乘子法

结果

降维导致 d-d'个特征值的特征向量被舍弃了,舍弃这部分信息能使样本的采样密度增大,另外,当数据受到噪声影响时,最小的特征值所对应的特征向量往往与噪声有关,将他们舍弃能在一定程度上起到去噪的作用。