您现在的位置是:首页 > 技术资料 > PCA主成分分析原理
推荐星级:
  • 1
  • 2
  • 3
  • 4
  • 5

PCA主成分分析原理

更新时间:2026-06-11 10:12:21 大小:16K 上传用户:烟雨查看TA发布的资源 标签:pca 下载积分:2分 评价赚积分 (如何评价?) 打赏 收藏 评论(0) 举报

资料介绍

一、PCA基本概念

主成分分析(Principal Component Analysis,简称PCA)是一种经典的无监督降维算法,核心思想是通过正交变换将一组可能存在相关性的高维变量转换为一组线性不相关的低维变量,转换后的这组低维变量就称为主成分。

PCA的核心目标可以归纳为两点:

1. 最大方差理论:降维后的数据尽可能保留原始数据的方差信息,也就是保留最多的原始数据差异性

2. 最小重构误差理论:降维后的数据重构回原始空间时,和原始数据的误差尽可能小

两种目标最终推导得到的结论是一致的,都是求解协方差矩阵的特征向量,取特征值最大的对应特征向量构成投影矩阵。

二、PCA的核心原理

1. 数据预处理

在进行PCA计算之前,通常需要对原始数据做两步预处理:

· 中心化:对每一维特征减去该特征的均值,保证特征均值为0,这样才能让协方差矩阵的计算不受均值偏移的影响

· 标准化:如果不同特征的量纲差异很大,需要对特征做标准差标准化,也就是除以每个特征的标准差,避免量纲大的特征主导方差计算

假设原始数据集为,其中$n$是样本数量,$d$是原始特征维度,中心化处理后的数据集为:

 

其中是每个特征的均值构成的行向量。


部分文件列表

文件名 大小
PCA主成分分析原理.docx 16K

全部评论(0)

暂无评论

上传资源 上传优质资源有赏金

  • 打赏
  • 30日榜单

推荐下载