以下为《主成分分析实操练习题》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
主成分分析实操练习题
/
要求:1)给出几个主成分;2)对每个主成分进行解释和命名,即每个主成分代表的是什么信息;3)若有两个以上的主成分,将它门综合为一个指标(以方差贡献度为权重)。
数据:35个大城市数据-主成分分析.xlsx
实验过程
一、建立实验数据
利用STATA数据编辑器将相关数据导入STATA,并修改变量名称,便于后续分析,如图1所示。
/
图1 建立合适的实验数据
二、查看数据数量级差异
首先输入命令“des,simple”查看数据变量名,检查变量名是否准确;其次输入命令“list in 1/2”,罗列前两项数据,查看数据数量级差异,如图2所示。
/
图2 查看数据数量级差异
通过简单查看,各数据均为正数,且除“非农业占比”外,其他变量数据均>1,数据为正,便于分析。
三、判断是否适合主成分分析
输入命令“pwcorr 年底总人口 非农业人口比 农业总产值 工业总产值 客运总量 货运总量 地方财政预算内收入 城乡居民年底储蓄余额 在岗职工人数 在岗职工资总额, sig star(.05) print(.05)”,得出变量间相关系数,如图3所示。
/
图3 变量相关系数
通过观察相关系数,得出变量间相关系数总体较高,个别变量间相关系数不高,但不影响总体结果,适合做主 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 成分对该变量的代表性也越大。可以看出,第一主成分对各个变量解释的很充分。
五、使用综合指标
按照主成分与解释变量的相关系数,分别输入命令“gen comp1=0.2758*年底总人口+0.0593*非农业人口比+0.2401*农业总产值+0.3403*工业总产值+0.1861*客运总量+0.3782*货运总量+0.3644*地方财政预算内收入+0.3812*城乡居民年底储蓄余额+0.3832*在岗职工人数+0.3799*在岗职工资总额”和“gen comp2=0.4191*年底总人口-0.5487*非农业人口比+0.4438*农业总产值-0.2065*工业总产值+0.4405*客运总量-0.0278*货运总量-0.2152*地方财政预算内收入-0.1214*城乡居民年底储蓄余额-0.0071*在岗职工人数-0.1668*在岗职工资总额”,计算主成分得分,并列举主成分comp1和comp2一部分数据,如图6所示。
/
图6 计算主成分得分
按照各个主成分的方差贡献率占所提取的主成分的累计方差贡献率的比重,输入命令“gen comp=comp1*(0.626/0.861)+comp2*(0.235/0.861)”生成综合性指标,并列举综合指标comp一部分数据,如图7所示。
/
图7 生成综合指标
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《主成分分析实操练习题》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。