降维方法

2019年10月04日 11点热度 0人点赞 0条评论


特征选择的维数

在特征选择中往往会选择一些多余的特征,它增加了维数,从而增加了聚类分析的复杂度,但对模式分类却没有提供多少有用的信息。在这种情况下,需要去掉相关程度过高的特征(进行降维处理)。

降维方法

设有N个样本,它们的特征维数是n,则有n*n维的相关矩阵 R=[rij]nxn
其中,rij是第i维与第j维特征之间的相关系数:rij=

λijσiiσjjfrac{λ_{ij}}{σ_{ii}σ_{jj}}


这里:σii和σjj分别是第i个和第j个分量的标准差,λij是第i个和第j个分量的协方差。
分析:

  1. 根据相关系数的性质: (利用柯西不等式证明)

  2. rijr_{ij}

    =0:表示两个分量完全不相关


  3. rijr_{ij}

    =1:表示两个分量完全相关

病人的病程

0 ~ 代表病程 <= 1个月
1 ~ 代表1个月< 病程 <= 6个月
2 ~ 代表6个月< 病程 <= 12个月
3 ~ 代表病程 > 12个月

未经允许不得转载!降维方法

update

纸上得来终觉浅, 绝知此事须躬行。