[SPSS] 파일 합치기_가로

전공/DATA

ssugirang 2020. 3. 8. 17:05

[ 개념 ]

match file은 데이터를 가로로 합치는 것

이렇게!

보통 데이터가 row(행) 값은 같고 column(열) 값이 다른 값일 때 사용한다

eg. 노란 박스가 1번 부터 100번 번호의 사람이 Q1-Q5 문항에 대한 데이터라면 보라 박스는 같은 사람의 Q6-Q10 문항에 대한 데이터. 즉, 동일 인물에 대해 Q1부터 Q10까지 데이터를 연결하려 할 때 사용한다.

[ Syntax ]

CD 'C:\project\spss'.

ADD FILES FILE="data1.sav"
         /FILE="data2.sav".

SAVE OUTFILE = "add_files_result.sav".

CD 'C:\project\spss'.
경로
ADD FILES FILE="data1.sav"
/FILE="data2.sav".
합칠 데이터 data1과 data2
SAVE OUTFILE = "add_files_result.sav".

합쳤을 때 만들어질 파일명

[ 예제 ]

ID가 모두 같고 column(Q1, Q2, Q3 vs Q4, Q5, Q6)이 모두 다를 경우

(before)

(after)

결론: data1과 data2가 가로로 붙었다

[ 심화 예제 ]

1. ID는 모두 같은데 column 중 같은 column(Q1, Q2, Q3 vs Q1, Q2, Q4)이 있으면 어떻게 될까?

(before)

(after)

결론: Q1, Q2와 같이 같은 column이 있을 경우 syntax에서 먼저 사용된 데이터의 column값을 쓴다.

eg. match FILES FILE="matchfiles_data3.sav"
/FILE="matchfiles_data4.sav".

data3을 먼저 쓴다면 합친 데이터에서는 data3의 column Q1 Q2만 찍힌다

2. 만약 합치려는 데이터 내에 다른 ID가 있다면 어떻게 될까? (지금까지의 앞의 예제는 모두 ID가 같았음)

(before)

(after)

결론: data5의 ID 103 과 data6의 ID 104 가 서로 다름. 이 경우에도 위와 같이 syntax에서 먼저 사용된 ID를 모두 사용하고 이후 data의 ID는 사용하지 않음을 알 수 있음.

eg. match FILES FILE="matchfiles_data5.sav"
/FILE="matchfiles_data6.sav".

그러나 이 경우 ID를 고려하지 않고 무작정 붙여지므로 data6에서 ID가 104이면서 Q4의 값이 5였지만, 결과 파일을 보면 ID 103이 Q4의 값을 5로 가지고 있음. 이렇게 사용하지 않도록 주의 주의