ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [SPSS] 파일 합치기_가로_MATCH FILE
    전공/DATA 2020. 3. 8. 17:05

    [ 개념 ]

    match file은 데이터를 가로로 합치는 것

    이렇게!

    보통 데이터가 row(행) 값은 같고 column(열) 값이 다른 값일 때 사용한다 

    eg. 노란 박스가 1번 부터 100번 번호의 사람이 Q1-Q5 문항에 대한 데이터라면 보라 박스는 같은 사람의 Q6-Q10 문항에 대한 데이터. 즉, 동일 인물에 대해 Q1부터 Q10까지 데이터를 연결하려 할 때 사용한다. 

     

    [ Syntax ]

    CD 'C:\project\spss'.
    
    ADD FILES FILE="data1.sav"
             /FILE="data2.sav".
    
    SAVE OUTFILE = "add_files_result.sav".
    

    CD 'C:\project\spss'.
    경로
    ADD FILES FILE="data1.sav"
                  /FILE="data2.sav".
    합칠 데이터 data1과 data2
    SAVE OUTFILE = "add_files_result.sav".

    합쳤을 때 만들어질 파일명

     

    [ 예제 ]

    ID가 모두 같고 column(Q1, Q2, Q3 vs Q4, Q5, Q6)이 모두 다를 경우

    (before)

    data1
    data2

    (after)

    match_files_result

    결론: data1과 data2가 가로로 붙었다

     

    [ 심화 예제 ]

    1. ID는 모두 같은데 column 중 같은 column(Q1, Q2, Q3 vs Q1, Q2, Q4)이 있으면 어떻게 될까? 

    (before)

    data3
    data4

    (after)

    match_files_result2

    결론: Q1, Q2와 같이 같은 column이 있을 경우 syntax에서 먼저 사용된 데이터의 column값을 쓴다.

    eg. match FILES FILE="matchfiles_data3.sav"
                        /FILE="matchfiles_data4.sav".

    data3을 먼저 쓴다면 합친 데이터에서는 data3의 column Q1 Q2만 찍힌다

     

    2. 만약 합치려는 데이터 내에 다른 ID가 있다면 어떻게 될까? (지금까지의 앞의 예제는 모두 ID가 같았음)

    (before)

    data5
    data6

    (after)

    match_files_result3

     

    결론: data5의 ID 103 과 data6의 ID 104 가 서로 다름. 이 경우에도 위와 같이 syntax에서 먼저 사용된 ID를 모두 사용하고 이후 data의 ID는 사용하지 않음을 알 수 있음.

    eg. match FILES FILE="matchfiles_data5.sav"
                        /FILE="matchfiles_data6.sav".

    그러나 이 경우 ID를 고려하지 않고 무작정 붙여지므로 data6에서 ID가 104이면서 Q4의 값이 5였지만, 결과 파일을 보면 ID 103이 Q4의 값을 5로 가지고 있음. 이렇게 사용하지 않도록 주의 주의

    댓글