【高分悬赏】Pearson相关系数矩阵是怎么求出来的啊??

发布网友发布时间：2022-04-27 04:55

共2个回答

热心网友时间：2022-06-26 13:53

1 方法

　　性质1：设X是一个随机变量，其分布函数为F(x)，则Y=F(X)服从在〔0，1〕的均匀分布。

　　性质2：设X1,K,Xn是某个分布的一个简单样本，其分布函数为F(x)，由性质1可知，在概率意义下，F(X1),F(X2),K,F(Xn)在（0,1）上呈均匀分布，按从小到大依次排序，记为F(X�1),F(X�2),K,F(X�n)，其相应理论值应为ri=i-0,5[]n，i=1，2，…，n，对应分布函数的反函数值F-1(r1),F-1(r2),K,F-1(rn)（在卡方分布中即为卡方分数）应非常接近X�1,X�2K,X�n，故在概率意义下，这些散点(X�1,F-1(r1)),(X�2,F-1(r2)),L,(X�n,F-1(rn))应在一条直线上。

　　根据性质2，如果X服从正态分布，则散点理论上应落在一直线上，可以用Pearson系数刻画这种分布。但由于随机变异的存在，Pearson系数并不等于1，所以通过随机模拟的方法，制定出Pearson系数的95%界值下限。

　　性质3：由条件概率公式P(X,Y)=P(Y|X)P(X)可知：（X，Y）服从二元正态分布的充分必要条件是固定X，Y服从正态分布(条件概率分布)并且X的边际分布为正态分布。由线性回归的性质ε=Y-(α+βX)可知，固定X，Y的条件概率分布为正态分布的充分必要条件是线性回归的残差ε服从正态分布，由此可得：（X，Y）服从二元正态分布的充分必要条件是X的边际分布为正态分布以及线性回归模型Y=α+βX+ε中的残差服从正态分布。
设X来自于正态总体，从正态总体中随机模拟抽样5000次，每次抽样样本含量分别为7至50，对F(x)求秩，求出排序后的F(x)和排序后的X的Pearson相关系数。表1 随机模拟5000次得到的检验正态分布的Pearson相关系数的界值（略）

　　类似地，我们也可以用同样的方法得到检验卡方分布的Pearson相关系数的界值表（简化表）表2 相关系数界值表（略）

　　2 随机模拟验证

　　2�1 Pearson相关系数界值表的随机模拟验证

　　设X来自于正态总体，从正态总体中随机模拟抽样5000次，每次抽样样本含量分别为10，20，30，40，50，并计算相应的Pearson卡方系数，以及落在界值外面的比例，即拒绝比例，再在同一批数据的前提下用McNemar检验比较本方法和Swilk法的差别。表3 （一元正态分布）模拟次数（略）表4（一元偏态分布，χ2)模拟次数（略）

　　以上方法拒绝比例在样本量为7的可信区间为［78.37%，94.12%］，在其余样本量时都接近100%，可以证实是正确的。

　　2�2 卡方分布界值表的随机模拟验证　

　　表5 卡方分布：模拟5000次（略）

　　
　　2�3 马氏距离的随机模拟验证

　　根据马氏距离的定义，从正态分布总体中随机抽取样本量分别为10，20，30，40，50的样本模拟5000次，根据上面提到的方法以卡方分数对X�1,X�2K,X�n求Pearson系数，并根据以上的相关系数界值表，计算相应的统计量，即拒绝比例。表6 马氏距离落在Pearson系数界值表外的比例（略）

　　2�4 二元正态分布资料的随机模拟验证

　　设定一个二维矩阵A，分别求出特征值P和特征向量Z，设X的元素均来自于正态总体分布，则Y=Z′×X必服从二元正态分布，随机模拟5000次，根据性质三介绍的方法验证的拒绝比例如下。表7 （二元正态分布）模拟次数（略）表8 （二元偏态分布，χ2）模拟次数（略）

　　2�5 三元正态分布资料的随机模拟验证

　　类似地，随机模拟5000次，用同样方法进行验证，得到对于三元正态分布数据的拒绝比例。表9 （三元正态分布）模拟次数：5000次

热心网友时间：2022-06-26 13:53

给个网址吧http://www.fjmu.e.cn/news/stat/jbtj2.htm

全部频道

【高分悬赏】Pearson相关系数矩阵是怎么求出来的啊??