-
[SPSS] 파일 합치기_가로_MATCH FILE전공/DATA 2020. 3. 8. 17:05
[ 개념 ]
match file은 데이터를 가로로 합치는 것
이렇게!
보통 데이터가 row(행) 값은 같고 column(열) 값이 다른 값일 때 사용한다
eg. 노란 박스가 1번 부터 100번 번호의 사람이 Q1-Q5 문항에 대한 데이터라면 보라 박스는 같은 사람의 Q6-Q10 문항에 대한 데이터. 즉, 동일 인물에 대해 Q1부터 Q10까지 데이터를 연결하려 할 때 사용한다.
[ Syntax ]
CD 'C:\project\spss'. ADD FILES FILE="data1.sav" /FILE="data2.sav". SAVE OUTFILE = "add_files_result.sav".
CD 'C:\project\spss'.
경로
ADD FILES FILE="data1.sav"
/FILE="data2.sav".
합칠 데이터 data1과 data2
SAVE OUTFILE = "add_files_result.sav".합쳤을 때 만들어질 파일명
[ 예제 ]
ID가 모두 같고 column(Q1, Q2, Q3 vs Q4, Q5, Q6)이 모두 다를 경우
(before)
(after)
결론: data1과 data2가 가로로 붙었다
[ 심화 예제 ]
1. ID는 모두 같은데 column 중 같은 column(Q1, Q2, Q3 vs Q1, Q2, Q4)이 있으면 어떻게 될까?
(before)
(after)
결론: Q1, Q2와 같이 같은 column이 있을 경우 syntax에서 먼저 사용된 데이터의 column값을 쓴다.
eg. match FILES FILE="matchfiles_data3.sav"
/FILE="matchfiles_data4.sav".data3을 먼저 쓴다면 합친 데이터에서는 data3의 column Q1 Q2만 찍힌다
2. 만약 합치려는 데이터 내에 다른 ID가 있다면 어떻게 될까? (지금까지의 앞의 예제는 모두 ID가 같았음)
(before)
(after)
결론: data5의 ID 103 과 data6의 ID 104 가 서로 다름. 이 경우에도 위와 같이 syntax에서 먼저 사용된 ID를 모두 사용하고 이후 data의 ID는 사용하지 않음을 알 수 있음.
eg. match FILES FILE="matchfiles_data5.sav"
/FILE="matchfiles_data6.sav".그러나 이 경우 ID를 고려하지 않고 무작정 붙여지므로 data6에서 ID가 104이면서 Q4의 값이 5였지만, 결과 파일을 보면 ID 103이 Q4의 값을 5로 가지고 있음. 이렇게 사용하지 않도록 주의 주의
'전공 > DATA' 카테고리의 다른 글
[SPSS] 파일 합치기_세로_ADD FILE (0) 2020.03.15 [SPSS] SAV파일 TXT로 뽑기 (0) 2020.03.07 [EXCEL] RANDBETWEEN 함수 (0) 2020.02.19 [데이터분석] 모든 문자 개별 count하기(feat. 모임에 제일 많이 참석한 사람 은 누구?) (0) 2020.02.09 [EXCEL] COUNTIF 특정 글자 카운트하기 (0) 2020.02.09