关键词不能为空

当前您在: 主页 > 英语 >

numeraire实验四 主成分分析

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2021-01-20 13:08
tags:

bramble-numeraire

2021年1月20日发(作者:climax)
实验四


主成分分析


1.
根据1998
年部分地区洪灾损失数据
(见表
1

进行主成分分析,
看看哪些省受灾
较轻?受灾最重的是哪几个省?其中
x1

x12< br>分别为:
受灾面积、
成灾面积、
绝收面积、
受灾
/
万 人次、成灾
/
万人次、死亡(人)
、伤病(人)
、紧急转移(人)
、 倒塌房屋
/
万间、
损坏房屋
/
万间、死亡大牲畜
/
万头、直接经济损失
/
亿元。


表一:
1998
年部分地区洪灾损失指标数据

地区



























x1
130.4
109.7
242.9
199.6
69.7
241.6
254.0
213.0
79.3
128.2
65.3
39.9
40.8
x2
107.7
64.7
160.6
130.8
23.7
193.6
169.0
141.3
54.8
75.4
49.4
16.1
26.2
x3
64.8
26.7
93.7
57.1
4.4
87.8
44.5
39.9
28.2
16.9
6.7
3.5
4.8
x4
448.0
306.1
581.0
1562.0
597.5
2381.0
1939.0
2178.0
1378.5
1757.9
904.0
462.7
650.0
x5
375.0
214.5
521.0
1012.8
455.8
1702.6
1534.7
1652.4
992.8
1044.3
668.2
52.8
475.0
x6
147
7
2
93
146
237
353
854
315
581
304
166
215
x7
105476
311000
316844
262461
8402
126505
891200
224400
38000
14806
21715
235
3069
x8
97.7
98.3
156.4
100.4
195.3
304.6
247.4
350.8
81.1
37.0
39.1
7.6
12.7
x9
37.0
56.0
82.0
26.9
68.9
117.9
86.9
93.9
10.7
21.2
17.1
10.4
9.9
x10
59.0
62.3
75.0
49.3
167.8
168.2
241.2
224.5
76.3
43.1
27.1
14.8
24.6
x11
36.0
14.8
16.1
1.0
100.0
50.7
27.0
83.9
6.6
13.1
4.5
1.5
1.8
x12
164.0
140.0
218.0
130.5
87.9
434.2
357.0
422.8
114.9
74.7
55.5
23.1
43.0

解:
主成分分析就是设 法将原来众多具有一定相关性的变量
(

p
个变量
)
重新组合
成一组新的相互无关的综合变量来代替原来变量。用
R=corrcoef(A)
函数求相关系数矩阵:

matlab
程序如下:

A=[130.4 107.7 64.8 448.0 375.0 147 105476 97.7 37.0 59.0 36.0 164.0;
109.7 64.7 26.7 306.1 214.5 7 311000 98.3 56.0 62.3 14.8 140.0;
242.9 160.6 93.7 581.0 521.0 2 316844 156.4 82.0 75.0 16.1 218.0;
199.6 130.8 57.1 1562.0 1012.8 93 262461 100.4 26.9 49.3 1.0 130.5;
69.7 23.7 4.4 597.5 455.8 146 8402 195.3 68.9 167.8 100.0 87.9;
241.6 193.6 87.8 2381.0 1702.6 237 126505 304.6 117.9 168.2 50.7 434.2;
254.0 169.0 44.5 1939.0 1534.7 353 891200 247.4 86.9 241.2 27.0 357.0;
213.0 141.3 39.9 2178.0 1652.4 854 224400 350.8 93.9 224.5 83.9 422.8;
79.3 54.8 28.2 1378.5 992.8 315 38000 81.1 10.7 76.3 6.6 114.9;
128.2 75.4 16.9 1757.9 1044.3 581 14806 37.0 21.2 43.1 13.1 74.7;
65.3 49.4 6.7 904.0 668.2 304 21715 39.1 17.1 27.1 4.5 55.5;
39.9 16.1 3.5 462.7 52.8 166 235 7.6 10.4 14.8 1.5 23.1;
40.8 26.2 4.8 650.0 475.0 215 3069 12.7 9.9 24.6 1.8 43.0];
R=corrcoef(A)



得到相关系数矩阵为
:
R =[1.0000

0.9774


0.8312


0.6270


0.6968



0.1553



0.6925



0.7391



0.7760



0.6218



0.2295



0.8448



1




0.9774

1.0000

0.8830


0.6399



0.7119



0.1381



0.6219



0.7211



0.7585



0.5733



0.1904



0.8671






0.8312

0.8830

1.0000


0.3171



0.3910


-0.1947



0.3837



0.5145



0.6219



0.2845



0.0849



0.6583






0.6270

0.6399

0.3171


1.0000



0.9753



0.6655



0.3028



0.6327



0.4681



0.6084



0.2444



0.7100






0.6968

0.7119

0.3910


0.9753



1.0000



0.6402



0.4020



0.7315



0.5710



0.7110



0.3207



0.7989






0.1553

0.1381

-0.1947


0.6655



0.6402



1.0000


-0.0049



0.3832



0.1336



0.4353



0.3404



0.3832






0.6925

0.6219

0.3837


0.3028



0.4020


-0.0049



1.0000



0.4619



0.5036



0.5842



0.0066



0.5593






0.7391

0.7211

0.5145


0.6327



0.7315



0.3832



0.4619



1.0000



0.9252



0.9259



0.7506



0.9298






0.7760

0.7585

0.6219


0.4681



0.5710



0.1336



0.5036



0.9252



1.0000



0.8215



0.6584



0.8865






0.6218

0.5733

0.2845


0.6084



0.7110



0.4353



0.5842



0.9259



0.8215



1.0000



0.7399



0.8275






0.2295

0.1904

0.0849


0.2444



0.3207



0.3404



0.0066



0.7506



0.6584



0.7399



1.0000



0.4965






0.8448

0.8671

0.6583


0.7100



0.7989



0.3832



0.5593


0.9298



0.8865



0.8275



0.4965



1.0000

]
如果将选取的第一个线性组合即第一个综合变量记为F1
,自然希望
F1
尽可能多的
反映原来变量的信息。
最经典的 方法就是用方差来表示,

var(F1)
越大,
表明
F1
包含
的信息越多。有相关系数矩阵得知表明
12
个指标之间都没有线性相关性。

所以:

1
、将原始数据标准化。不同的指标具有不同的量纲,有时会导 致各指标取值的分
散程度较大,这样在计算协方差矩阵时,可能出现总体的方差主要受方差较大的数据的
控制,
可能造成不合理的结果。
为消除量纲的影响,
所以用函数
A1 =zscore(A)
对原始数
据进行标准化;

2
、用函数
corrcoef(A1)
建立指标之间的相关系数阵
R


3< br>、用函数
eig

R


R
的特征值和特征 向量;

4
、用函数
W=sum(D)/sum(sum(D))
计算贡献率;

5
、用函数
F=A1*V
计算主成分得分;

6
、 用函数
Y=F(:,10:12)*W(:,10:12)'
计算综合评价值得分;

7

Y=F(:,10:12)*W(:,10:12)'
计算综合评价值得 分;

8
、用函数
[Y1,L1]=sort(Y,'descend')< br>;
L1
给出受灾最严重的序号;

9
、用函数
[Y2 ,L2]=sort(L1)L2
给出各省受灾综合排名。

Matlab
程序如下:

A1=zscore(A);
[V,D]=eig(corrcoef(A1))
W=sum(D)/sum(sum(D))
F=A1*V
Y=F(:,10:12)*W(:,10:12)'
[Y1,L1]=sort(Y,'descend');
[Y2,L2]=sort(L1)
结果如下:

V =0.5463 -0.0135 -0.0444 0.2781 -0.3102 -0.4132 0.3530 0.1965 -0.0140 -0.1155 0.2666 0.3275
-0.2179 -0.6379 0.2048 -0.4927 0.0694 -0.0394 0.0985 0.1328 -0.1388 -0.1494 0.2835 0.3243
-0.2311 0.3160 -0.1798 0.2533 0.2744 0.3975 0.1677 0.1769 -0.4376 -0.0135 0.4576 0.2376
-0.2379 0.0990 -0.5687 -0.1462 -0.1271 -0.1795 0.1080 -0.4465 -0.1074 -0.4340 -0.2266 0.2795
0.1720 0.2198 0.6676 0.0668 0.2297 0.1318 0.0774 -0.3694 -0.0476 -0.3512 -0.1941 0.3100
-0.1412 0.0241 -0.0156 0.1156 0.1396 -0.0528 -0.0435 0.7190 -0.0017 -0.3261 -0.5451 0.1458
-0.2390 0.3329 0.0126 -0.1756 0.0003 0.0497 0.1188 0.1167 0.8031 -0.0597 0.2711 0.2209
-0.4115 -0.0799 0.2214 0.3314 -0.6583 0.1396 -0.1458 -0.0443 -0.0390 0.2395 -0.1134 0.3431
-0.1627 0.1191 0.0327 0.1025 0.3950 -0.6264 -0.4149 -0.0643 -0.0534 0.3328 0.0662 0.3243
0.1771 -0.4685 -0.2732 0.3500 0.3496 0.3123 0.1080 -0.1627 0.3144 0.2312 -0.2029 0.3173
0.0468 0.2473 0.0161 -0.4203 -0.0037 0.0035 0.5032 0.0536 -0.1569 0.5662 -0.3479 0.1936
0.4561 0.1491 -0.1710 -0.3552 -0.1541 0.3248 -0.5880 0.1028 -0.0493 0.0207 0.0122 0.3548

2

D = 0.0005 0 0 0 0 0 0 0 0 0 0 0
0 0.0022 0 0 0 0 0 0 0 0 0 0
0 0 0.0112 0 0 0 0 0 0 0 0 0
0 0 0 0.0143 0 0 0 0 0 0 0 0
0 0 0 0 0.0181 0 0 0 0 0 0 0
0 0 0 0 0 0.0713 0 0 0 0 0 0
0 0 0 0 0 0 0.1188 0 0 0 0 0
0 0 0 0 0 0 0 0.2232 0 0 0 0
0 0 0 0 0 0 0 0 0.7442 0 0 0
0 0 0 0 0 0 0 0 0 1.3429 0 0
0 0 0 0 0 0 0 0 0 0 1.9569 0
0 0 0 0 0 0 0 0 0 0 0 7.4964

W =0.0000 0.0002 0.0009 0.0012 0.0015 0.0059 0.0099 0.0186 0.0620 0.1119 0.1631 0.6247
由上数据第一、二和 第三主成成分的累积贡献率为
89.97%
,可取前三个主成分,特征向量对应
矩阵< br>V
的第一、二和第三行。第一主成分反应
直接经济损情况,第二主成分反应元死亡大牲< br>畜情况,第三主成分反应损坏房屋情况。

F =-0.0050 0.0014 -0.0279 -0.2227 0.0937 0.4660 0.2566 0.6344 -0.6693 0.7142 1.0293 -0.7486
-0.0147 0.1068 0.0169 -0.0553 -0.0938 -0.1770 -0.4649 0.0467 0.7698 1.0036 1.1053 -1.4047
0.0049 -0.0245 0.0426 0.2323 0.0730 -0.1985 0.0703 0.5373 -0.4968 0.6227 2.7443 1.0977
0.0083 0.0039 0.0293 -0.0432 -0.2987 -0.0242 0.5857 -0.4360 -0.1766 -1.2027 1.3589 0.0796
-0.0003 -0.0062 0.0090 0.0366 0.0341 -0.1165 0.4958 -0.5042 0.1068 2.8463 -1.6479 -0.6726
-0.0001 -0.0093 -0.0453 -0.0837 0.0696 -0.0852 -0.4357 -0.7972 -1.4505 -0.0055 0.3941 4.4499
0.0011 -0.0282 -0.0311 -0.0394 0.1143 0.0783 0.0777 -0.1362 2.2881 -0.5296 0.5200 4.0526
0.0066 0.0039 0.0333 0.0444 -0.1858 0.0715 -0.1574 0.7889 -0.2181 0.0911 -2.4795 4.3879
-0.0200 0.0439 -0.0287 0.2151 0.0585 0.5416 -0.0038 -0.3847 -0.1670 -0.9720 -0.6554 -1.2766
-0.0017 0.0454 -0.0833 -0.0333 0.1739 -0.4672 0.3482 0.3012 -0.3542 -1.7009 -1.2632 -0.9763
-0.0396 -0.0629 0.2241 -0.0546 0.0177 -0.1117 -0.1826 -0.0229 0.0306 -0.6453 -0.5718 -2.3467
-0.0043 -0.0716 -0.2405 0.0160 -0.1180 -0.0635 -0.3159 0.0977 0.2018 0.1055 -0.1262 -3.5777
0.0649 -0.0028 0.1016 -0.0122 0.0616 0.0863 -0.2741 -0.1250 0.1353 -0.3274 -0.4078 -3.0645
综合得分及排名如下表所示:

序号

综合得分

1
-0.2198
2
-0.5850
3
1.2029
4
0.1367
5
-0.3704
6
2.8435
7
2.5572
8
2.3469
9
-1.0131
10
-1.0062
11
-1.6314
12
-2.2438
13
-2.0175
排名

6
8
4
5
7
1
2
3
10
9
11
13
1
根据排名,很显然重庆、云南、陕西的受灾程度较轻 ,而江西、湖北、湖南三省的
灾情较为严重。


3

2 .
国内
35
个大城市某年的
10
项社会经济统计指标数据见下表2
,对其进行主成分
分析,给出各地区主成分得分及综合得分与排名。



2
:某年的
10
项社会经济统计指标数据

城市名













石家庄






呼和浩特
















哈尔滨


































































广







































西









西









乌鲁木齐

年底总
人口
(


)
1249.90
910.17
875.40
299.92
207.78
677.08
545.31
691.23
927.09
1 313.12
537.44
616.05
538.41
429.95
583.13
128.99
424.20
557.63
702.97
615.36
740.20
582.47
685.00
119.85
285.87
54.38
3 072.34
1 003.56
321.50
473.39
674.50
287.59
133.95
95.38
158.92
非农业人
口比
(%)
0.5978
0.5809
0.2332
0.6563
0.4412
0.6299
0.4946
0.4068
0.4627
0.7384
0.5341
0.3556
0.2547
0.3184
0.2733
0.4865
0.3988
0.4085
0.3693
0.3424
0.5869
0.3107
0.6214
0.7931
0.4064
0.8354
0.2067
0.335
0.4557
0.3865
0.4094
0.5445
0.5227
0.5709
0.8244
农业总产


(
万元
)
1843427
1501136
2918680
236038
365343
1295418
1879739
1853210
2663855
2069019
989199
1414737
1428235
628764
2152288
333374
688289
1486302
2382320
677425
1211291
1146367
1600738
299662
720486
44815
4168780
1935590
362061
793356
739905
259444
65848
171603
78513
工业总产值

(
万元
)
19999706
22645502
6885768
2737750
816452
5826733
8426385
5966343
4186123
54529098
13072737
12000796
10622866
2514125
6555351
5751124
2305881
6285882
11492036
5287601
7506085
3098179
23348139
20368295
1149691
717461
8585525
5894289
2247934
3605729
3665942
2940884
711310
661226
1847241
客运

总量

(
万人
)
20323
3259
2929
1937
2351
7782
10780
4810
6720
6406
14269
17883
22215
4893
8851
3728
3674
5915
13408
10433
9793
8706
22007
8754
5130
5345
52441
40140
15703
5604
10311
1832
1746
2106
2668
货运

总量

(
万吨
)
45562
26317
1911
11895
2623
15412
19187
9532
7520
44485
11193
11684
10298
1517
7190
2570
3189
11775
17038
6768
15442
5718
23854
4274
3293
2356
25124
19632
4143
12042
9766
4749
1469
1193
9041
地方财政
预算内收


(
万元
)
2790863
1128073
352348
203277
105783
567919
709227
357096
481443
4318500
664299
449593
501723
233628
467524
418758
167714
460690
658435
387252
604658
323660
1 761499
1847908
149700
115174
898912
561189
197908
524216
408896
169540
49134
74758
254870
城乡居民年底
储蓄

余额
(
万元
)
26806646
11301931
7095875
3943100
1396588
9016998
7556796
4803744
6450020
25971200
5680472
7425967
5246350
1622931
5030220
2108331
2640460
4126970
4978045
5135338
5748055
3461244
20401811
9519900
2190918
1626800
9090969
7479684
1787748
4127900
5863980
2641568
855051
814103
2365508
在岗职工
人数

(
万人
)
410.80
202.68
95.60
88.65
42.11
135.45
94.15
102.63
172.79
336.84
113.81
96.90
62.15
47.27
69.59
46.93
62.08
83.31
103.52
84.66
149.20
69.57
182.81
91.26
45.09
19.01
223.73
132.89
55.28
88.11
114.01
65.83
27.21
23.72
55.27
在岗职工
工资总额

(
万元
)
5773301
2254343
758877
654023
309337
1152811
965922
884447
1309151
5605445
1357861
1180947
824034
369577
680607
657484
479555
756 696
961704
696848
1314766
596986
3047594
1890338
371809
198138
1606804
1200671
419681
842321
885169
550890
219251
178621
517622

解:
主成分分析就是设法将原来众 多具有一定相关性的变量
(

p
个变量
)

重新组 合
成一组新的相互无关的综合变量来代替原来变量。用
R=corrcoef(A)
函 数求相关系数矩阵:

matlab
程序如下:

A=[1249.90 0.5978 1843427 19999706 20323 45562 2790863 26806646 410.80 5773301;
910.17 0.5809 1501136 22645502 3259 26317 1128073 11301931 202.68 2254343;
875.40 0.2332 2918680 6885768 2929 1911 352348 7095875 95.60 758877;
299.92 0.6563 236038 2737750 1937 11895 203277 3943100 88.65 654023;
207.78 0.4412 365343 816452 2351 2623 105783 1396588 42.11 309337;
677.08 0.6299 1295418 5826733 7782 15412 567919 9016998 135.45 1152811;
545.31 0.4946 1879739 8426385 10780 19187 709227 7556796 94.15 965922;
691.23 0.4068 1853210 5966343 4810 9532 357096 4803744 102.63 884447

4

bramble-numeraire


bramble-numeraire


bramble-numeraire


bramble-numeraire


bramble-numeraire


bramble-numeraire


bramble-numeraire


bramble-numeraire



本文更新与2021-01-20 13:08,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/538703.html

实验四 主成分分析的相关文章