第四章 多组资料均数尤其的SAS编程实现

2022-01-10 02:39:59 来源:
分享:
多3组有数据资料大多有数尤其我们一般领域于方差研究的方法有,SAS在此之前方差研究的特性非常全面,能意味着方差研究特性的流程有anova流程和glm流程。

一、anova流程和glm流程简介

1. anova流程

anova流程存在于stat模块,合而为一要的特性就是顺利进行方差研究。anova流程来顺利进行对有利于的系统有数据资料(各分3组原因各总体的所有三配对具有有所不尽相同的样本量或检视绝对值)顺利进行研究,并不需要应用于对非有利于的系统有数据资料的方差研究。它比glm流程的直通速度要太快,建议的存贮空间也要小一些。

anova流程的一般文档如下:

PROC ANOVA < 选项择年表> ;

CLASS 操只用符名年表 ;

MODEL 理应操只用符=自操只用符操只用符 < / 选项择年表> ;

ABSORB 操只用符年表 ;

BY 操只用符名 ;

FREQ 操只用符名 ;

MANOVA < 鉴定选项择>< / 详细选项择> ;

MEANS 自操只用符操只用符 < / 选项择> ;

REPEATED 操只用符名 总体有数 <(各总体绝对值)>< / 选项择> ;

TEST < H=操只用符操只用符> E=操只用符操只用符;

proc anova句子关机anova流程的直通,日后的选项择年表可内含不限重大项目:

DATA=有数据有数据资料集名

MANOVA

MULTIPASS

NAMELEN=n

NOPRINT

ORDER=DATA | FORMATTED | FREQ | INTERNAL

OUTSTAT=SAS-data-set

其在此之前的“order=”选项择自行决定anova流程对界定操只用符(class句子自行决定的操只用符)各总体的次序模式,选项的四个条目分别透露按照原始有数据有数据资料在此之前的顺序排列、输入文档绝对值的顺序排列、各总体检视绝对值频有数多少的顺序排列、内部绝对值的顺序排列顺利进行次序。其余选项择和在此在此之前的素材有所不尽相同或较少用到,这里不再继续一一断言。

日后的class句子、by句子、freq句子等和在此在此之前的素材基本上有所不尽相同,我们这里着眼于了解一下anova流程在此之前特有的关键句子。

model句子:用来自行决定理应操只用符和自操只用符,并且通过特定的操只用符规定自操只用符的关键只用用模式。如果没有自行决定任何自操只用符,则三维在此之前非常少相关联常有数项,此时鉴定的素材是理应操只用符的大多有数是否为零。model句子在此之前自行决定的自操只用符必并须是class句子在此之前声明过的界定操只用符,anova流程不允许自操只用符在此之前有连续HG操只用符(有数绝对值操只用符),而理应操只用符则必并须是有数绝对值HG操只用符。

自操只用符操只用符必需来表达三种不尽相同的效理应三维,即合而为一效理应三维、交互效理应三维、链表所设计效理应三维。我们假设理应操只用符为y,a, b, c为三维在此之前相关联的三个自操只用符,各种效理应三维的表达模式如下:

(1)合而为一效理应三维:y=a b c;

(2)交互效理应三维:y=a b c a*b a*c b*c a*b*c;

(3)链表所设计三维:y=a b c(a b); 其在此之前c原因为a、b两原因各种三配对下的二级原因。

model句子副标题的选项择有“intercept”和“nouni”两项,分别自行决定SAS顺利进行关于常有数项的假设鉴定和在多操只用符方差研究(或减法精确测量有数据资料方差研究)时禁令单操只用符总和结果的输入。

absorb句子:对于非常少发挥合而为一效理应的原因,absorb句子自行决定SAS消除此操只用符的关键只用用,只对其余操只用符顺利进行研究,关键只用用大幅度减少量化机技术资源和时间消耗的关键只用用。理领域此特性时,并须不须对自行决定操只用符次序,且此操只用符并不需要再继续经常出现在class句子和model句子在此之前。

manova句子:当反理应操只用符有多个时,此句子控制anova流程转回多元方差研究模式,日后的选项择来顺利进行自行决定多元方差研究时的各项衡量。

means句子:自行决定anova流程量化自行决定操只用符各总体下反理应操只用符的大多绝对值、标准差,并顺利进行3组间的多重尤其。

repeated句子:如果反理应操只用符为减法精确测量有数据有数据资料,此句子来顺利进行自行决定anova流程转回减法精确测量有数据有数据资料方差研究模式。其在此之前的操只用符名都有减法精确测量原因(如精确测量时间等),日后总体有数都有减法精确测量的次有数,如果需自行决定减法精确测量各次的具体标志,可在日后按顺序排列列出,并用逗号括一起。

test句子:来顺利进行顺利进行其他多种类HG的f鉴定,这种鉴定不尽相同于不一定方差研究在此之前以最大值大多不须为正整数的f鉴定,其在此之前的选项择“h=”来顺利进行自行决定只用为分子的操只用符操只用符(必并须在model句子在此之前经常出现过),“e=”来顺利进行自行决定一个只用为正整数的操只用符。

2. glm流程

glm流程也存在于stat模块在此之前,它执行以最小二乘法顺利进行三维拟合的特性。以此流程可以意味着的生物学方法有有紧接著研究、方差研究、协方差研究、多元方差研究以及偏相关研究。glm流程对有数据有数据资料的研究处理大多在一般差分三维的开放性下顺利进行,反理应操只用符可以为一个或多个连续HG操只用符,自操只用符可为连续HG也可为线性HG。

glm流程的一般文档如下:

PROC GLM < 选项择年表> ;

CLASS 操只用符名年表 ;

MODEL 理应操只用符=自操只用符年表 < / 选项择年表> ;

ABSORB 操只用符名年表 ;

BY 操只用符名年表 ;

FREQ 操只用符名年表 ;

ID 操只用符名年表 ;

WEIGHT 操只用符名年表 ;

CONTRAST '标明' 效理应操只用符 常有数formula_ < ... 效理应操只用符 常有数formula_> < / 选项择年表> ;

ESTIMATE '标明' 效理应操只用符 常有数formula_ < ... 效理应操只用符 常有数formula_> < / 选项择年表> ;

LSMEANS效理应操只用符< / 选项择年表> ;

MANOVA < 鉴定选项择>< / 详细选项择> ;

MEANS 效理应操只用符 < / 选项择年表> ;

OUTPUT < OUT=有数据有数据资料集名> keyword=names < / 选项择> ;

RANDOM效理应操只用符 < / 选项择年表> ;

REPEATED 原因操只用符 < / 选项择年表> ;

TEST < H=操只用符操只用符> E=操只用符操只用符< / 选项择年表> ;

Proc glm句子图标glm流程的开始,此句后的选项择可有不限重大项目。

DATA=有数据有数据资料集名

ALPHA=p

MANOVA

MULTIPASS

NAMELEN=n

NOPRINT

ORDER=DATA | FORMATTED | FREQ | INTERNAL

OUTSTAT=SAS-data-set

可以见到此选项择年表非常少比anova流程的多了一个重大项目,即“alpha=p”选项择,此选项择用来自行决定量化流程在此之前所领域于的显著性总体。其余选项择的辞汇和意思与anova流程的有所不尽相同,这里不再继续多说了。

大家可以尤其一下glm流程和anova流程所包括的句子,anova流程在此之前包括的所有句子都相关联在glm流程所包括的句子在此之前,其辞汇和特性也都是基本有所不尽相同的,这一部分句子这里就不再继续赘述。

Contrast句子使你可以用定制的模式顺利进行假设鉴定,它必并须经常出现在model句子之后,如果用到manova句子、repeated句子、random句子或test句子,contrast句子必并须经常出现在这些句子在此之前。标明用来标志所顺利进行的鉴定,来顺利进行标志的文字或字母能用单引号括一起。效理应操只用符来顺利进行自行决定假设鉴定的原因(三配对),这些原因(三配对)必并须是model句子在此之前经常出现过的。效理应操只用符后的常有数formula_来顺利进行自行决定相理应原因(三配对)各总体的绝对值,在自行决定各总体的只能顺利进行相关原因的研究。

Estimate句子可意味着对差分方程的估计,它也必并须经常出现在model句子之后,领域于的原则上和contrast句子基本有所不尽相同。其在此之前的句子要素的意思和辞汇也与contrast句子有所不尽相同。

Lsmeans句子来顺利进行请示SAS对自行决定的原因(三配对)量化理应操只用符的最小二乘大多有数并输入到结果在此之前。

Output句子我们在在此在此之前的素材在此之前接触过,其特性和辞汇和在此在此之前的素材也基本有所不尽相同,各位请求参考在此在此之前的素材领域于。

Random句子来顺利进行自行决定哪些原因(三配对)是随机操只用符,即一般而言这些原因(三配对),样本是来自于正态总体的随机样本,这样SAS可对相理应原因(三配对)只用随机效理应三维的研究。

对以上几条句子的理解基本上来自SAS的帮助文件,由于专业知识深度不够以及英语总体有限的原因,以上关于这几种句子的素材但会存在很多的严重错误与偏差,还请求各位;还有忧心,也渴望各位能;还有指点。更进一步的素材我但会给出第一时间的更新。

二、不尽相同所设计多种类HG有数据资料的方差研究

需顺利进行多3组大多有数尤其的有数据资料所设计多种类HG有基本上随机所设计、随机单位3组所设计、析因所设计、减法精确测量所设计等,下面我们分别以实例来示范SAS在此之前这类有数据有数据资料的研究方法有。

1. 基本上随机所设计有数据资料的方差研究(含大多有数间的多重尤其)

例4-1 为了解烫伤后不尽相同时代切痂对消化系统三乙酸激酶(简写为ATP)所含的影响,将30只雄性鼠类随机分33组, 每3组10只:A3组为烫伤对照3组,B3组为烫伤后24小时(心力衰竭期)切痂3组,C3组为烫伤后96小时(非心力衰竭期)切痂3组,全部哺乳动物统合在烫伤后168小时处死并精确测量其消化系统的ATP所含,结果见表4.1。请求鉴定三3组鼠类消化系统的ATP所内含无差别。

表4.1 鼠类烫伤后消化系统ATP所含的精确测量结果(单位:mg)

A3组

B3组

C3组

7.76

11.14

10.85

7.71

11.60

8.58

8.43

11.42

7.19

8.47

13.85

9.36

10.30

13.53

9.59

6.67

14.16

8.81

11.73

6.94

8.22

5.78

13.01

9.95

6.61

14.18

11.26

6.97

17.72

8.68

针对以上有数据资料,我们领域于anova流程来意味着方差研究的特性。编制SAS处理程序如下:

data temp;

infile 'e:datadata4_1.txt';

do i=1 to 10;

do g=1 to 3;

input x@@;

output;

end;

end;

proc anova;

class g;

model x=g;

Run;

quit;

本段处理程序在此之前用到SAS的尿素句子,其文档和多有数量化机技术脚本语言软件包在此之前的有所不尽相同,我一般而言它的辞汇和意思并不需要再继续多罗嗦了。灵活运用尿素句子在SAS脚本语言流程在此之前可以浪费很多的精力。此处因为有数据有数据资料毗邻不尽相同的列在此之前,每行相关联每一3组的一个有数据有数据资料,用尿素句子正好可以激发一个都有不尽相同分3组的操只用符,省去了全都输入造就的更糟。必需提醒各位要特别强调的是,尿素句子的每一个do句子,必并须有一个相理应的end句子来终止它,否则就但会出错。

此处必需研究的操只用符(理应操只用符)是x,打压原因(自操只用符)为分3组操只用符g,因而model句子在此之前效理应操只用符为x=g。

提出上述处理程序,结果如下。

The SAS System 10:49 Monday, October 14, 2002 5

The ANOVA Procedure

Class Level Information

Class Levels Values

g 3 1 2 3

Number of observations 30

The SAS System 10:49 Monday, October 14, 2002

分享:
365整形网 整形医院哪家好 五官整容整形 整形医院咨询 整形知识 整形医生 美容整形 整形医院排名 整形医院咨询 整形专业知识 济南整形医院 C店求购 快手买卖平台 抖音号出售 出售公众号网站 买卖小红书网站 出售快手网 出售小红书网站