以下为《五到七章分析内容》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
第五章 判别分析
第一节:距离判别法(4个)
1、判别分析的定义
已知研究对象已经分成若干类的情况下,确定新的样品属于哪一类的多元统计分析方法。
判别分析处理问题时,通常要给出衡量新样品与各已知类别接近程度的指标,即判别函数,同时也指定一种判别准则(如距离准则、费舍准则、贝叶斯准则),借以判定新样品的归属。
2、判别分析的基本思想
首先根据已知分类的数据,分别计算各类的重心,即分类均值;
在此基础上,距离判别准则是对于任给一新样品的观测值,若它与第i类的重心距离最近,就认为它来自第i类。
距离判别法对各类总体的分布没有特定的要求。
3、两总体距离判别法判别准则
/
4、两总体距离判别法判别函数
/
第二节:费舍判别法(5个)
1、基本思想
投影(降维),将k类p维数据投影到某一个方向(作线性组合),使得投影后类与类之间尽可能分开。
2、判别函数
3、数学本质
4、判别能力/累积判别能力
由于A-1B的非零特征根有m个,由此对应有m 个特征向量,即m个判别函数。
前m0个判别函数的累积判别能力定义为
如果m0使得上式达到某个给定的值(比如85%),则就可以认为m0个判别函数就能够反映原始变量的大部分信息了。
5、一个判别函数,不加权的判别准则
费舍判别法本身并未给出最合适的分类法,我们可以按照距离最近的原则对样品的线性组合进行归类。
第三节:贝叶斯判别法(2个)
1、贝叶斯判别法的2个判别准则
后验概率最大化准则
平均损失最小化准则
2、先验概率的确定方法
均等处理
样品数量占比
第四节:逐步判别分析(1个)
1、基本思想
逐步判别分析方法是在多组判别分析基础上发展起来的一种方法,其基本思路类似于逐步回归分析,采用“有进有出”的算法。每步引入或剔除变量,都要作相应的统计检验,使最后的判别函数仅保留“重要”的变量。
第五节:判别分析应用实例(3个)
1、掌握费舍判别法的SPSS操作步骤
2、掌握贝叶斯判别法的SPSS操作步骤
3、能够对输出结果进行合理的解释
第六章 主成分分析
1、主成分的概念
主成分分析要做的是将原来众多具有一定相关性的变量,重新组合为一组新的相互无关的综合变量(主成分)来代替原始变量。
2、主成分与原始变量的关系
每个主成分是各原始变量的线性组合
各个主成分之间互不相关
主成分的数目大大小于原始变量的数目
主成分保留了原始变量的绝大多数信息
3、主成分数学表达式
/
4、线性变换的三个原则
/
5、几何解释
第二节
1、引理的理解
2、主成分系数
3、累积方差贡献率
4、因子载荷量
第三节
1、样本主成分
样本主成分分析可以得到p个主成分,由于各个主成分的方差是递减的,包含的信息量也是递减的。所以实际分析时,一般不是选取p个主成分,而是根据各个主成分累积方差贡献率的大小选取前m个主成分。
2、注意事项
主成分分析与样本数据;主成分分析与标准化;主成分的解释;主成分分析结果应用
3、分析步骤
(1)根据原始变量特性判断是由协差阵出发求解主成分,还是由相关阵出发求解主成分。
(2)求协差阵或相关阵的特征根与相应的标准特征向量。
(3)得到主成分表达式,并确定主成分个数,选取主成分。
(4)计算主成分得分。
(5)依据主成分表达式及主成分得分,结合研究问题进行深入分析。
第七章 因子分析
第一节
1、因子(公共因子、特殊因子)
因子分析是通过变量(或样品)的相关性结构的研究,找出存在于
所有变量(或样品)中具有共性的因素,并综合为少数几个新变量,把原始变量表示成少数几个综合变量的线性组合,以再现原始变量与综合变量之 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 合。
(3)因子分析可称地上是统计模型化技术。而主成分分析充其量不过是将变量通过线性组合重新表述,分析中不需要特别强调假设,只是一种数据变换。
(4)主成分分析中,当协差阵或相关阵的特征根是唯一确定的时候,主成分一般是固定的。而因子分析中因子不是固定的,可以通过旋转得到不同因子。
(5)提取因子的方法不仅仅只有主成分法,还有极大似然法、主因子法等。基于这些不同算法,得到的结果一般是不同的。而主成分只能用主成分法提取。
4、关于Q型因子分析
关于Q型因子分析具体来讲,进行R型因子分析时,我们常用相关系数来描述变量之间的相互关系。在进行Q型因子分析时应当选择样品之间的相似性度量,一般用相似系数。
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]请点击下方选择您需要的文档下载。
以上为《五到七章分析内容》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。