当前位置: 网站首页 >> 2019 >> SPSS统计分析方法 >> 课程首页 >> 正文

SPSS篇——数据的合并

发布者: [发表时间]:2020-09-27 [来源]: [浏览次数]:

在实际工作中,为了提高效率,经常需要将一份数据分成几部分分别录入,为了最终的研究分析,又需要将几个数据文件合并成一个总的数据文件。SPSS提供了两种合并数据文件的方式:添加变量、添加个案。

(一)添加变量即横向合并。

将不同的变量合并到一个数据文件,进行左右对接。

键变量的介绍:

1. 若两个要合并的数据文件,不是按照记录编号的对应规则进行合并,则至少要有一个相同名称的公共变量(SPSS24中称为键变量)。(一般来说,若需要对数据合并,在录入时都会按照记录编号的对应规则录入数据,用键变量合并较少使用,所以只在后文说明方法,不举具体案例。)

2. 若使用相同键变量合并,键变量必须按升序排列。

案例:将某班的化学成绩和英语成绩合并成一个数据文件。

Ps:首先观察两个数据文件,两个数据文件中的成绩都为按照学生编号从1-20进行排列,不用考虑按键变量合并。

操作步骤:

Step1. 打开化学成绩.sav ,数据——合并文件——添加变量。


Step2.此时出现下图,有两种打开另一个数据文件的方式。

一种为打开数据集,需要事先在SPSS中打开另一个数据文件(本例为英语成绩),此时就会在打开数据集的对话框中出现另一个数据文件,点击数据文件,继续即可。


另一种为点击外部SPSS Statistics数据文件,此方法无需事先打开另一数据文件,只需知道数据文件存放在哪里,在浏览里选择即可(本例的英语成绩所在位置为桌面),最后点击继续


Step3.此时出现下图,本例不用键变量合并也无需修改,按确定即可。

以下分别对每个对话框进行解释:

【排除的变量】对话框。变量为两个要合并的数据文件中变量名称相同的变量(即重复的变量名),此对话框里的变量将不会出现在合并后的数据文件中。若想要将此对话框中的变量纳入合并后的数据文件,则需要选中变量,点击重命名,重新命名后再移入到新的活动数据集对话框中。(从实际经验中,很少会出现此情况)

【新的活动数据集】对话框。变量为合并后的数据文件中包含的变量。“*”表示此变量为当前文件中的变量,“+”表示此变量为外部文件中的变量。在本案例中编号和化学成绩为当前文件中的变量,英语成绩为外部文件中的变量,符合实际情况。

【键变量】对话框。若需要使用键变量进行合并时,需要对键变量进行设置。变量为两个数据文件中的相同变量(在【排除的变量】对话框中选择),需提前将键变量升序排列,勾选【按键变量匹配个案】,勾选【两个数据集中的个案都按键变量的顺序进行排序】,此时下方的复选框被激活:

[非活动数据集是键控表]表示以外部数据文件的变量为主,只纳入与外部数据文件相同的变量为合并后的数据文件。

[活动数据集是键控表]表示以当前数据文件的变量为主,只纳入与当前数据文件相同的变量为合并后的数据文件。

[两个文件都提供个案]表示将两个数据文件的变量都纳入都合并后的数据文件中。

以上三种方式,根据实际的要求选择,设置完成后,将键变量移入【键变量】对话框中。

【指示个案源变量】若勾选则在合并后的数据文件中出现一个名为source01的新变量,0表示变量来自当源文件,1表示变量来自被合并的文件。没有要求,一般不用勾选。


结果:在数据视图中出现完成合并后的数据文件。


(二)添加个案即纵向合并

只合并两个数据文件中相同变量下的数据,进行纵向连接。

案例:某班共30名学生,将30名学生的化学成绩分成了两个数据文件,要求将学生编号为1-20的数据文件和编号为21-30的数据文件合并,形成一个30名学生的数据文件。

操作步骤:

Step1.打开编号1-20.sav,数据——合并文件——添加个案。


Step2.此时的操作步骤与横向合并的相同,本例点击外部SPSS Statistics数据文件,点击浏览,本例编号21-30数据文件的位置为桌面,点击继续。


Step3.此时出现下图,本例直接确定即可。

以下分别对每个对话框进行解释:

【非成对变量】对话框。变量为两个要合并的数据文件中没有相同名称的变量,所以不能被系统自动匹配,若在此对话框中的两个数据变量,变量意义相同但是名字不同,需要纵向合并,则同时选中两个变量名,点击配对,进行强行匹配。

Ps:为了操作方便,两个数据文件中相同含义的变量,命名应相同,类型和长度也最好相同。

【新的活动数据集中的变量】对话框。变量为两个数据文件中名称相同的变量,也是合并后的数据文件中所包含的变量。

“*”、“+”、【指示个案变量】的含义与横向合并中的意义相同。


结果:在数据视图中得到了编号从1-30学生的化学成绩。