![Скачать презентацию SPSS 软件 6 非参数检验 说明 非参数检验这章 请看下面吴 喜之教授的讲义 更为具体的可参看 统计分析与SPSS的应用 薛薇 编著 Скачать презентацию SPSS 软件 6 非参数检验 说明 非参数检验这章 请看下面吴 喜之教授的讲义 更为具体的可参看 统计分析与SPSS的应用 薛薇 编著](https://present5.com/wp-content/plugins/kama-clic-counter/icons/ppt.jpg)
853001b6881477d5ac51e6494941f3d1.ppt
- Количество слайдов: 77
SPSS 软件 6. 非参数检验 说明:非参数检验这章,请看下面吴 喜之教授的讲义,更为具体的可参看 《统计分析与SPSS的应用》薛薇 编著 人大出版社,2002. 7第二次印刷
非参数检验的概念 是指在总体不服从正态分布且分布情况不 明时,用来检验数据资料是否来自同一个 总体假设的一类检验方法。由于这些方法 一般不涉及总体参数故得名。 这类方法的假定前提比参数性假设检验方 法少的多,也容易满足,适用于计量信息 较弱的资料且计算方法也简单易行,所以 在实际中有广泛的应用。
非参数检验的过程 1. Chi-Square test 卡方检验 2. Binomial test 二项分布检验 3. Runs test 游程检验 4. 1 -Sample Kolmogorov-Smirnov test 一个样本 柯尔莫哥洛夫-斯米诺夫检验 5. 2 independent Samples Test 两个独立样本检验 6. K independent Samples Test K个独立样本检验 7. 2 related Samples Test 两个相关样本检验 8. K related Samples Test 两个相关样本检验
6. 1 卡方检验 Chi-Square test 这里介绍的卡方检验可以检验列联表中某一个变量的各 个水平是否有同样比例或者等于你所想象的比例(如 5: 4: 1) 实例1:掷骰子 300次,变量LMT,1、2、3、4、5、 6分别代表六面的六个点,试问这骰子是否均匀。数据 data 12 -01(300个cases)。 n n Analyze-> Nonparametric Tests->Chi Square Test Variable: lmt 想要检验的变量 由 于 这 是 一 个 均 匀 分 布 检 测 , 使 用 默 认 选 择 ( Expected Values:All categories equal作为零假设); 比较有用的结果:sig=. 111>0. 5,不能拒绝零假设,认为均匀。 实 例 1的 数 据 可 以 组 织 成 : 两 个 变 量 ( side面 和 number次数),6个cases。但在卡方检验前要求用 number加权。结果同。
补充:卡方检验实例 实例:心脏病人猝死人数与日期的关系,收集168个观 测数据。其中用 1、2、3、4、5、6、7表示是星期几 死的。而人数分别为 55、23、18、11、26、20、15。 推断心脏病人猝死人数与日期的关系是否为 2. 8: 1: 1: 1。(变量 2个:死亡日期和死亡人数, Cases 7个) 加权:Data->Weight Cases:死亡人数 Analyze-> Nonparametric Tests->Chi Square n n n Test Variable: 死亡日期 Expected Values: 2. 8: 1: 1: 1 比较有用的结果:sig=. 256>0. 5,不能拒绝零假设,认为心 脏病人猝死人数与日期的关系为 2. 8: 1: 1: 1 。
6. 2 二项分布检验 Binomial test 二项分布:在现实生活中有很多的取值是两类的,如人 群的男和女、产品的合格和不合格、学生的三好学生和 非三好学生、投掷硬币的正面和反面。这时如果某一类 出现的概率是P,则另一类出现的概率就是 1 -P。这种 分布称为二项分布。 实例1:掷一枚比赛用的挑边器 31次,变量tbh,1为出 现A面、2为出现A面,试问这挑边器是否均匀。数据 data 12 -03(31个cases)。 n n Analyze-> Nonparametric Tests-> Binomial Test Variable: tbh 由 于 这 是 一 个 均 匀 分 布 检 测 , 使 用 默 认 选 择 ( Test Proportion: 0. 5); 比较有用的结果:两组个数和sig=1. 00>0. 5,不能拒绝零假 设,认为挑边器是均匀。 实 例 1的 数 据 可 以 组 织 成 : 两 个 变 量 ( side面 和 number次数),2个cases。但在二项分布检验前要 求用number加权。结果同。
6二项分布检验实例 实例:为验证某批产品的一等品率是否达到 90%,现 从该批产品中随机抽取 23个样品进行检测,结果有19 个一等品(1-一等品,0-非一等品)。(变量 2个: 一等品和个数,Cases 2个: 1 19 和0 4) 加权:Data->Weight Cases:个数 Analyze-> Nonparametric Tests-> Binomial n n n Test Variable: 一等品 Test Proportion: 0. 9 比较有用的结果:两组个数和sig=. 193>0. 5,不能拒绝零假 设,认为该批产品的一等品率达到了90% 。
6. 3 游程检验Runs test 单样本变量随机性检验是对某变量值出现是否随机进行 检验。 实例1(同二项分布检验) :掷一枚比赛用的挑边器 31 次,变量tbh,1为出现A面、2为出现A面,试问这挑 边 器 出 现 AB面 是 否 随 机 。 数 据 data 12 -03( 31个 cases)。 Analyze-> Nonparametric Tests-> Runs n Test Variable: tbh n Cut Point:Custom: 2 n 比较有用的结果: 总case数(31)、 游程Run数(21)、 sig=. 142>0. 5, 不能拒绝零假设, 认为挑边器出现AB面是随机的。 n
6. 4 一个样本柯尔莫哥洛夫-斯米诺夫检验 1 -Sample Kolmogorov-Smirnov test 单样本K-S检验是利用样本数据推断总体是否服从某一理论分布, 适用于探索连续型随机变量的分布形态(判断定距变量的分布情况) : Normal正 态 分 布 、 Uniform均 匀 分 布 、 Poisson泊 松 分 布 、 Exponential指数分布。 实例 :卢瑟福和盖革作了一个著名的实验,他们观察了长为 7. 5秒 的时间间隔里到达某个计数器的由某块放射物资放出的alfa粒子质 点数,共观察了2608次。数据data 12 -05(1个变量zd, 2608 个cases,按0-10排序)。试问这种分布规律是否服从泊松分布 n Analyze-> Nonparametric Tests->1 -Sample K-S n Test Variable: zd n Test Distribution: Poisson n 比较有用的结果: 均值(3. 8673)、 sig=. 850>0. 5, 不能拒绝零假设, 认为服从泊松分布。
6. 5 两个独立样本检验 2 independent Samples Test 通过分析两个样本数据,推断它们的分布是否存在显著性差异。方 法有四种: n n Mann-Whitney U: 是通过对平均秩的研究来实现推断的 K-S Z:是通过对分布的研究来实现推断的 Moses extreme reactions:一个作为控制样本,另一个作为实验样本 Wald Wolfwitz Runs: 是通过对游程的研究来实现推断的 实例 :甲乙两种安眠药服用后的效果。数据data 12 -06(2个变量: 组别zb和延长时间ycss, 20个cases)。试问这两种药物的疗效 是否有显著性差异。 n n n Analyze-> Nonparametric Tests-> 2 independent Samples Test Variable: ycss Grouping: zb(1,2) Test type:四种均选 比较有用的结果:比较四个sig值,有三个sig>. 5,不能拒绝零 假设认为疗效无显著性差异。
6. 6 多个独立样本检验 K independent Samples Test 通过分析多个样本数据,推断它们的分布是否存在显著性差异。方 法有三种: n n n Median:是通过对中位数的研究来实现推断的 K-W:是通过对推广的平均秩的研究来实现推断的 J-T:与两个独立样本检验的Mann-Whitney U类似 实例 :某车间用四种不同的操作方法检测产品优等品率的实验数据。 数据data 12 -07(2个变量: 方法ff和优等品率ydpl, 21个cases )。试问这四种不同的操作方法对产品优等品率是否有显著性差异。 n n n Analyze-> Nonparametric Tests-> K independent Samples Test Variable: ydpl Grouping: ff(1,4) Test type:三种均选 比 较 有 用 的 结 果 : 比 较 三 个 sig值 , K-W方 法 的 sig=. 009<. 05, 拒绝零假设, 认为这四种不同的操作方法对产品优等 品率是有显著性差异。其他二个方法的sig>. 5,但不用,原因 是观测量太少。
6. 7 两个相关样本检验 2 related Samples Test 同一个被测试者,前后测两次,彼此相关。方法有四种。 实例 :某校 15名男生的长跑锻炼后晨脉变化数据。数 据data 12 -08(2个变量: 锻炼前dlq和锻炼后dlh优, 21个cases)。试问锻炼前后的晨脉有无显著性差异。 n n Analyze-> Nonparametric Tests-> 2 related Samples Test Pairs: dlq-dlh Test type:选一种或多种 比较有用的结果:看sig值,sig<. 05, 拒绝零假设, 认 为锻炼前后的晨脉有显著性的差异。
6. 8 多个相关样本检验 K related Samples Test 对多个被测试者,多个打分,看打分是否有显著性差异。 方法有三种: n n n n Cochran Q:要求样本数据为二值的(1-满意 0-不满意) Friedman:利用秩实现 Kendall协同系数检验:H 0:协同系数为 0(评分标准不相关的 或者是随机的) 实例 : 9个顾客对三种款式衬衫的喜爱程度(1-最喜爱 2-其 次 3-不喜爱)。数据data 12 -09(3个变量: 款式A,款式B, 款式C, 27个cases)。试问顾客对三种款式衬衫的喜爱程度 是否相同。 Analyze-> Nonparametric Tests-> k related Samples Test Variables: a b c Test type:选一种或多种 比较有用的结果:看sig值,sig<. 05, 拒绝零假设, 认 为顾客对三种款式衬衫的喜爱程度是不相同的。
补充:非参数检验 以下的讲义是吴喜之教授有关 非参数检验的讲义, 我觉得比书上讲得清楚。
非 参 数 检 验
为什么用非参数方法? 经典统计的多数检验都假定了总 体的背景分布。 但也有些没有假定总体分布的具 体形式,仅仅依赖于数据观测值 的相对大小(秩)或零假设下等 可能的概率等和数据本身的具体 总体分布无关的性质进行检验。 这都称为非参数检验。
为什么用非参数方法? 这些非参数检验在总体分布未知时有很大的优越 性。这时如果利用传统的假定分布已知的检验, 就会产生错误甚至灾难。 非参数检验总是比传统检验安全。 但是在总体分布形式已知时,非参数检验就不如 传统方法效率高。这是因为非参数方法利用的信 息要少些。往往在传统方法可以拒绝零假设的情 况,非参数检验无法拒绝。 但非参数统计在总体未知时效率要比传统方法要 高,有时要高很多。是否用非参数统计方法,要 根据对总体分布的了解程度来确定。
非参数方法 这里介绍一些非参数检验。 关于非参数方法的确切定义并不很明 确。我们就其最广泛的意义来理解。 在计算中,诸如列联表分析中的许多 问题都有精确方法,Monte Carlo抽 样方法和用于大样本的渐近方法等选 择。精确方法比较费时间,后两种要 粗糙一些,但要快些。
秩(rank) 非参数检验中秩是最常使用的概念。什么 是一个数据的秩呢?一般来说,秩就是该 数据按照升序排列之后,每个观测值的位 置。例如我们有下面数据 Xi 15 9 18 3 17 8 5 13 7 19 Ri 7 5 9 1 8 4 2 6 3 10 这下面一行(记为Ri)就是上面一行数 据Xi的秩。
秩(rank) 利用秩的大小进行推断就避免 了不知道背景分布的困难。这 也是大多数非参数检验的优点。 多数非参数检验明显地或隐含 地利用了秩的性质;但也有一 些非参数方法没有涉及秩的性质。
列联表问题 我们讲过列联表的c 2检验问题(第七章)。 这里介绍的检验可以检验列联表中某一个变量 的各个水平是否有同样比例或者等于你所想象 的比例。 每个检验都可以选择使用精确方法,Monte Carlo抽样方法或用于大样本的渐近方法。 利用数据table 7. sav,假定你想知道收入的 比例是否是 5比 4比 1(零假设)。而且选择精 确检验,你可以得到各种检验结果如下:
列联表问题 利用数据table 7. sav,假定你想知道收入的 比例是否是 5比 4比 1(零假设)。而且选择 精确检验,你可以得到各种检验结果如下:
列联表问题 该结果除了给出了精确检验的p值,表明无论 还给出渐近检验的p值;两个都是 0. 000;这 表明零假设的比例欠妥。输出还给出了 Pearson统计量中的Oi和Ei(分别为下表中 的Observed N和Expected N):
列联表问题 如果要检验变量的各水平是否都相等,从 SPSS可以得到对这三个变量的检验(对每 个变量的零假设是各水平影响相同)结果: SPSS还分别给出对每个变量的Pearson 统计量中的Oi和Ei。
SPSS软件使用说明 用table 7. sav数据。假定已经加权了(number: 权) Analyze- Nonparametric Tests- Chi Square。 然 后选择想要检验的变量(如income), 如要检验其水平是否相等,则在Expected Values选All categories equal作为零假设(默认选择); 如要检验其水平是否为某比例,则在下面Values输入你 的比例(我们是 5比 4比 1,逐个输入)作为零假设。 点Exact时打开的对话框中可以选择精确方法(Exact), Monte Carlo抽样方法(Monte Carlo)或用于大样本 的渐近方法(Asymptotic only)。 如果选入的变量多于一个,则检验的都是水平相等的零 假设。最后OK即可。
单样本Kolmogorov-Smirnov检验 单 样 本 的 Kolmogorov-Smirnov检 验 ( K-S检 验)是用来检验一个数据的观测累积分布是 否是已知的理论分布。 这些作为零假设的理论分布在SPSS的选项中 有正态分布(Normal),泊松分布(Poisson) , 均匀分布(Uniform)和指数分布(Exponential)。 在SPSS软件中对于是否是正态分布或均匀分 布的检验统计量为
数据ksdata. sav的K-S检验 我们检验它是否是正态分布、均匀分布和指数分布。输出 结果分别显示在下面三个表中: 由于sig=. 074>. 05,不能拒绝正态分布(Normal)零假 设。
由于sig=. 000<. 05,拒绝均匀分布(Uniform)零假设
由 于 sig=. 664>. 05, 不 能 拒 绝 指 数 分 布 (Exponential)零假设 比较三种分布检验,认为是该数据服从指数分布
SPSS软件使用说明 使用我们的ksdata. sav数据。 选项为Analyze-Nonparametric Tests-1 Sample K-S。 然后把变量(这里是x)选入Variable List。 再在下面Test Distribution选中零假设的分布 ( Normal、 Poisson、 Uniform和 Exponential)作为零假设。 在点Exact时打开的对话框中可以选择精确方 法 ( Exact) , Monte Carlo抽 样 方 法 ( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可。
关于随机性的游程检验(run test) 游程检验方法是检验一个取两个值的变 量的这两个值的出现是否是随机的。假 定下面是由 0和1组成的一个这种变量的 样本(数据run 1. sav): 000011111100101110000 其中相同的0(或相同的1)在一起称为 一个游程(单独的0或 1也算)。 这个数据中有4个 0组成的游程和3个 1组 成的游程。一共是R=7个游程。其中 0的 个数为m=15,而1的个数为n=10。
关于随机性的游程检验(run test) 出现 0和1的的这样一个过程可以看成是参数为 某未知p的Bernoulli试验。但在给定了m和n之 后,在 0和1的出现是随机的零假设之下,R的 条件分布就和这个参数无关了。根据初等概率 论,R的分布可以写成(令N=m+n)
关于随机性的游程检验(run test) 于是就可以算出在 零假设下有关R的 概率,以及进行有 关的检验了。利用 上面公式可进行精 确检验;也可以利 用大样本的渐近分 布和利用Monte Carlo方法进行检 验。利用上面数据 的结果是:
关于随机性的游程检验(run test) 当然,游程检验并不仅仅用于只取两个值的变量,它还 可以用于某个连续变量的取值小于某个值及大于该值的 个数(类似于0和1的个数)是否随机的问题。看下面例 子。 例 (run 2. sav): 从某装瓶机出来的30盒化妆品的重量如 下(单位克) 71. 6 71. 0 71. 8 70. 3 70. 5 72. 9 71. 0 70. 1 71. 8 71. 9 70. 3 70. 9 69. 3 71. 2 67. 3 67. 6 67. 7 67. 6 68. 1 68. 0 67. 5 69. 8 67. 5 69. 7 70. 0 69. 1 70. 4 71. 0 69. 9 为了看该装瓶机是否 作正常,首先需要验证是否大于 和小于中位数的个数是否是随机的(零假设为这种个数 的出现是随机的)。
关于随机性的游程检验(run test) 如果把小于中位数的记为 0,否则记为 1,上面数据变成下面的0-1序列 111101111010000110 这就归为上面的问题。当然这里进行 这种变换只是为了易于理解。实际计 算时,用不着这种变换,计算机会自 动处理这个问题的。 直接利用这个数据,通过SPSS,得到 下面游程检验结果的输出。
SPSS软件使用说明 用run 2. sav数据。 选项为Analyze-Nonparametric Tests-Runs。 然后把变量(这里是length)选入Variable List。 再在下面Cut Point选中位数(Median)。当然, 也可以选其他值,如均值(Mean),众数( Mode)或任何你愿意的数目(放在Custom)。 注意在对前面的由 0和1组成的序列(run 1. sav 进行随机性检验时,要选均值(为什么?)。 在点Exact时打开的对话框中可以选择精确方法 ( Exact) , Monte Carlo抽 样 方 法 ( Monte Carlo)或用于大样本的渐近方法(Asymptotic only)。最后OK即可。
Wilcoxon (Mann-Whitney)秩和检验 这里介绍常用的Wilcoxon (或称Mann-Whitney)秩和 检验。它的原理很简单, 假定第一个样本有 m个观测值,第二个有 n个观测值。 把两个样本混合之后把这m+n个观测值升幂排序, 记下每个观测值在混合排序下面的秩。之后分别把两个 样本所得到的秩相加。记第一个样本观测值的秩的和为 WX而第二个样本秩的和为WY。这两个值可以互相推算, 称为Wilcoxon统计量。 该统计量的分布和两个总体分布无关。由此分布可以得 到p-值。 直观上看,如果WX与WY之中有一个显著地大,则可以 选择拒绝零假设。 该检验需要的唯一假定就是两个总体的分布有类似的形 状(不一定对称)。
Wilcoxon (Mann-Whitney)秩和检验 下面数据(GDP. sav)是地区 1的十个城市和 地区 2的15个城市的人均GDP(元)。现在要 想以此作为两个样本来检验两个地区的人均 GDP的中位数m 1和m 2是否一样,即双尾检验 H 0: m 1=m 2对Ha: m 1≠m 2。由于地区 2的人 均GDP的中位数大于地区 1的中位数,因此也 可以做单尾检验H 0: m 1=m 2对Ha: m 1<m 2。 地区 1: 3223 45263836278159823216 4710562823034618 地区 2: 5391 39834076594147484600 6325453455265699700854036678 55375257 由SPSS的输出可以得到下面结果:
Wilcoxon (Mann-Whitney)秩和检验 该结果头两行显示了Mann-Whitney和 Wilcoxon统计量的值。另外和我们需要结果的 相关部分为:对于双尾检验H 0: m 1=m 2对Ha: m 1≠m 2,p-值为 0. 016(见“Exact Sig. (2 tailed)”);而对于单尾检验H 0: m 1=m 2对Ha: m 1<m 2(见“Exact Sig. (1 -tailed)”),p-值 为 0. 008。这两个结果是精确计算的。通常在样 本量大的时候利用近似方法得到渐近分布的p-值 (见“Asymp. Sig. (2 -tailed)”),它只给了双 尾检验的近似p-值 0. 017,和精确值差别不大。 注意单尾检验的p-值是双尾检验的p-值的一半。 这个例子的结果表明,可以拒绝原假设,即有理 由认为地区 2的人均GDP的中位数要高一些。
SPSS软件使用说明 使用GDP. sav数据。 选项为Analyze-Nonparametric Tests-2 Independent Samples。 把变量(gdp)选入Test Variable List;再 把用 1和2分类的变量area输入进Grouping Variable,在Define Groups输入 1和2。 在Test Type选中Mann-Whitney。 在点Exact时打开的对话框中可以选择精确 方法(Exact),Monte Carlo抽样方法( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
两样本分布的Kolmogorov-Smirnov检验 假定有分别来自两个独立总体的两个样本。要 想检验它们背后的总体分布相同的零假设,可 以进行两独立样本的Kolmogorov-Smirnov检验。 原理完全和单样本情况一样。只不过把检验统 计量中零假设的分布换成另一个样本的经验分 布即可。假定两个样本的样本量分别为n 1和n 2, 用S 1 (X)和S 2 (X)分别表示两个样本的累积经验 分布函数。再记Dj=S 1 (Xj)-S 2 (Xj)。近似正态 分布的检验统计量为
计算结果 twonp. sav:两种破坏性试验的持续时间。根据 这个数据,n 1=30,n 2=25。由SPSS输出,得到
SPSS软件使用说明 使用twonp. sav数据。 选项为Analyze-Nonparametric Tests-2 Independent Samples。 把变量(duration)选入Test Variable List; 再把用 1和2分类的变量type输入到 Grouping Variable,在Define Groups输入 1 和2。 在Test Type选中Kolmogorov-Smirnov Z。 在点Exact时打开的对话框中可以选择精确 方法(Exact),Monte Carlo抽样方法( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
两样本Wald-Wolfowitz游程检验(Wald-Wolfowitz runs test)和Kolmogorov-Smirnov检验都是 看两个样本所代表的总体是否分布类似。但 是所采取的方法不一样。Wald-Wolfowitz游 程检验把两个样本混合之后,按照大小次序 排列,一个样本的观测值在一起的为一个游 程。和单样本的游程问题类似。可以由游程 个数R看出两个样本在排序中是否随机出现。 由twonp. sav数据,可以得到下面SPSS关于 Wald-Wolfowitz游程检验的输出:
软件使用:数据和前面一样,只在 Test Type选Wald-Wolfowitz runs。
Kruskal-Wallis关于多个样本的秩和检验 这个检验的目的是看多个总体的位置参数 是否一样。 方法和Wilcoxon-Mann-Whitney检验 的思想类似。 假定有k个总体。先把从这个k个总体来 的样本混合起来排序,记各个总体观测值 的秩之和为Ri,i=1, …, k。显然如果这些 Ri很不相同,就可以认为它们位置参数相 同的零假设不妥(备选假设为各个位置参 数不全相等)。
Kruskal-Wallis关于多个样本的秩和检验 注意这里所说的位置参数是在下面意义上的qi; 由于它在分布函数Fi(x)中可以和变元x相加成为 F(x+qi)的样子,所以称qi为位置参数。 形式上,假定这些样本有连续分布F 1, …, Fk,零 假设为H 0:F 1=…=Fk,备选假设为Ha: Fi(x)=F(x+qi),i=1, …, k,这里F为某连续分 布函数,而且这些参数qi并不相等。Kruskal. Wallis检验统计量为
Kruskal-Wallis关于多个样本的秩和检验 公式中ni为第i个样本量,而N为各个样本量之 和(总样本量)。 如果观测值中有大小一样的数值,这个公式会 有稍微的变化。 这个统计量在位置参数相同的零假设下有渐近 的自由度为k-1的c 2分布。Kruskal-Wallis检验 仅仅要求各个总体变量有相似形状的连续分布。
数据house. sav:三个区域房价的数据 为了调查三个地区的房价是否类似,在每个地 区抽样,得到三个样本量分别为 20、30、25的 房价样本。利用SPSS软件,很容易得到下面的 检验结果:
SPSS软件使用说明 使用house. sav数据。 选项为Analyze-Nonparametric Tests-K Independent Samples。 把变量(这里是price)选入Test Variable List; 再把数据中用 1、2、3来分类的变量group输 入Grouping Variable,在Define Groups输入 1、2、3。 在下面Test Type选中Kruskal-Wallis H。 点Exact时打开的对话框中可以选择精确方法 (Exact),Monte Carlo抽样方法(Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
Jonckheere-Terpstra多样本的秩检验 这个检验处理的问题和Kruskal-Wallis检验类似,零假设 都是各个总体的位置参数相同,但这里的备选假设为各个 总体的位置参数按升幂排列(如为降幂排列,可把总体编 号颠倒顺序即为升幂排列)。 注意这里所说的位置参数和前面的Kruskal-Wallis检验中 的位置参数意义一样。 Jonckheere-Terpstra检验先在每两个样本所有观测值对 之间比较,计算第i个样本观测值中小于第j个样本观测值 的对子数:
数据house. sav:三个区域房价的数据 很容易得到 SPSS的 Jonckheere Terpstra检验 结果输出:
SPSS软件使用说明 使用house. sav数据。 选项为Analyze-Nonparametric Tests-K Independent Samples。 把变量(这里是price)选入Test Variable List;再把数据中用 1、2、3来分类的变量 group输入Grouping Variable,在Define Groups输入 1、2、3。 在下面Test Type选中Jonckheere-Terpstra。 在点Exact时打开的对话框中可以选择精确 方法(Exact),Monte Carlo抽样方法( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
Brown-Mood中位数检验 在有数个独立样本的情况,希望知道它们的中位数是否 相等。零假设是这些样本所代表的总体的中位数相等。 备选假设是这些中位数不全相等。 假定有k个总体,ni为第i个样本量;把所有样本量之和 记为N。先把从这个k个总体来的样本混合起来排序,找 出它们的中位数。再计算每个总体中小于该中位数的观 测值个数O 1 i,i=1, …, k,和每个总体中大于该中位数的 观测值个数O 2 i,i=1, …, k。这样就形成了一个由元素 Oij组成的2×k表。其列总和为ni,i=1, …, k;而两个行 总和为各样本小于总中位数的观测值总和:R 1= O 11+O 12+…+ O 1 k及各样本大于总中位数的观测值总和R 2 =O 21+O 22+…+ O 2 k。这显然是一个列联表,可以用 Pearson c 2统计量,即
这里 house. sav数据
SPSS软件使用说明 使用house. sav数据。 选项为Analyze-Nonparametric Tests-K Independent Samples。 把变量(这里是price)选入Test Variable List;再把数据中用 1、2、3来分类的变量 group输入Grouping Variable,在Define Groups输入 1、2、3。 在下面Test Type选中Median。 在点Exact时打开的对话框中可以选择精确 方法(Exact),Monte Carlo抽样方法( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
Friedman秩和检验 前面讨论了两因子试验设计数据 的方差分析,那里所用的F检验需 要假定总体的分布为正态分布。 有一种非参数方差分析方法,称 为Friedman (两因子)秩和检验, 或 Friedman方 差 分 析 。 它 适 用 于 两个因子的各种水平的组合都有 一个观测值的情况。
Friedman秩和检验 假定第一个因子有 k个水平(称为处理, treatment),第二个因子有b个水平(称 为区组);因此一共有k×b=kb个观测值。 这里之所以称一个因子为处理,是因为这 是我们想要看该因子各水平是否对试验结 果有显著的不同(它的各个水平的观测值 也就是本小节的多个相关样本)。而另一 个因子称为区组,不同的区组也可能对结 果有影响。下面是一个例子。
数据fert. sav 这里有三种肥料作为第一个因子(肥料因子)的 三个水平;而四种土壤为第二个因子(土壤因子) 的四个水平。感兴趣于是否这三种肥料对于某作 物的产量有区别。称肥料因子为处理,而土壤因 子为区组。数据在下表中(表中数字为相应组合 肥料种类 的产量,单位公斤)。 肥料A 土 壤 类 型 肥料B 肥料C 土壤 1 22 46 68 土壤 2 25 36 48 土壤 3 18 21 20 土壤 4 11 13 19
Friedman秩和检验 Friedman秩 和 检 验 是 关 于 位 置 的 , 和 Kruskal. Wallis检验类似,形式上,假定这些样本有连续 分布F 1, …, Fk,零假设为H 0:F 1=…=Fk,备选假设 为Ha: Fi(x)=F(x+qi), i=1, …, k,这里 F为某连续 分布函数,而且这些参数qi并不相等。 虽然这和以前的Kruskal-Wallis检验一样,但是由 于区组的影响, 要首先在每一个区组中计算各个 处理的秩;再把每一个处理在各区组中的秩相加. 如果 Rij表示在 j个区组中第 i个处理的秩。则秩按 照处理而求得的和为
Friedman秩和检验 这 样 做的目的是在每个区组 内比较 处 理。 例如, 同个年龄 段中比较 药 品的疗 效比不 分年龄 来比较 疗 效要合理;在同一个部位 比较 不同的材料要比混合起来比较 要合理 等等。这 里要引进 的Friedman统 计 量定义 为 第一个式子表明,如果各个处理很不一样,和的平方就 会很大,结果就显著。第二个公式是为了计算方便而导 出的。它有近似的(有k-1个自由度的)c 2分布。
fert. sav数据
SPSS软件使用说明 使用fert. sav数据。 选项为Analyze-Nonparametric Tests-K Related Samples。 然后把变量(这里是a、b、c)选入Test Variable List。 在下面Test Type选中Friedman。 在点Exact时打开的对话框中可以选择精确 方法(Exact),Monte Carlo抽样方法( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
Kendall协同系数检验 在实践中,常需要按照某些特别的性质来 多次对一些个体进行评估或排序;比如几 个(m个)评估机构对一些(n个)学校进 行排序。人们想要知道,这些机构的不同 结果是否一致。如果很不一致,则该评估 多少有些随机,意义不大。 换句话说,这里想要检验的零假设是:这 些对于不同学校的排序是不相关的或者是 随机的;而备选假设为:这些对不同学校 的排序是正相关的或者是多少一致的。
Kendall协同系数检验 一个机构对诸个体(学校)的秩(次序) 的和为 1+2+…+n=n(n+1)/2;所有 m个机 构对所有个体评估的总秩为 mn(n+1)/2; 这样对每个个体的平均秩为 m(n+1)/2。如 果记每一个个体的m个秩(次序)的和为Ri (i=1, …, n),那么,如果评估是随机的, 这些Ri与平均秩的差别不会很大,反之差别 会很大,也就是说下面的个体的总秩与平 均秩的偏差的平方和S很大。S定义为
Kendall协同系数检验 这 个 和 Kendall协 同 系 数 ( Kendall’s Coefficient of Concordance)是成比例的, Kendall协同系数W(Kendall’s W)定义为
数据school. sav 下面是 4个独立的环境研究单位对 15个学校排序 的结果每一行为一个评估机构对这些学校的排序。 看上去不那么一致(也有完全一致的):
数据school. sav SPSS的Kendall协同系数检验的输出
SPSS软件使用说明 使用school. sav数据。 选项为Analyze-Nonparametric Tests-K Related Samples。 然后把变量(这里是s 1、s 2、…、s 15 )选入 Test Variable List。 在下面Test Type选中Kendall’s W 。 在点Exact时打开的对话框中可以选择精确 方法(Exact),Monte Carlo抽样方法( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
关于二元响应的Cochran检验 前面讨论了两因子方差分析问题的Friedman秩和检验。 但是当观测值只取诸如0或 1两个可能值时,由于有 太多同样的数目(只有0和1),排序的意义就很成 问题了。 这里要引进的Cochran检验就是用来解决这个问题的 一个非参数检验。这里的零假设也是各个处理是相同 的。先看一个例子 关于瓶装饮用水的调查(数据在water. sav)。20名 顾客对 4种瓶装饮用水进行了认可(记为 1)和不认 可(记为 0)的表态。 我们感兴趣的是这几种瓶装水在顾客眼中是否有区别。 这里的零假设是这些瓶装水(作为处理)在(作为区 组的)顾客眼中没有区别。
数据water. sav 下表是数据,每一行为 20个顾客对某一饮料的20个观点(0 或 1)。最后一列 1为认可总数 Ni而最后一行为每个顾客给出 的4个观点中认可数的总和Li。最后一行的最后的元素为总认 可数N。 显然,如果Ni和这些Ni的均值的差距很大,那么这些处理就很 不一样了。Cochran检验就是基于这个思想的。用Ni 表示第i个 处理所得到的“ 1”的个数,而Lj为第j个区组(例子中的顾客)所 给的“ 1”的个数,“ 1”的总数记为N。
关于二元响应的Cochran检验统计量(Cochran’s Q)为( 假定有k个处理和b个区组) 当k固定时,Q在b很大时有近似的自由度 为k-1的c 2分布。
数据water. sav Cochran检验的SPSS输出:
SPSS软件使用说明 使用water. sav数据。 选项为Analyze-Nonparametric Tests-K Related Samples。 然后把变量(这里是c 1、s 2、c 3、c 4 )选入 Test Variable List。 在下面Test Type选中Cochran’s Q。 在点Exact时打开的对话框中可以选择精确 方法(Exact),Monte Carlo抽样方法( Monte Carlo)或用于大样本的渐近方法( Asymptotic only)。最后OK即可
853001b6881477d5ac51e6494941f3d1.ppt