ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [데이터분석] 모든 문자 개별 count하기(feat. 모임에 제일 많이 참석한 사람 은 누구?)
    전공/DATA 2020. 2. 9. 23:13

    하나의 문자가 몇 개 있는지 세는 것(단순 countif)이 아니라

    모든 문자를 각각 몇 개 있는지 전부 다 세야 한다면 어떻게 해야 할까? (countif를 모든 문자에 적용하기는 힘들다 ㅠㅠ)

     

    실생활 예로 들면, (지인과의 모임에서 실제로 있었던 일이고, 아래 방법을 통해 구했다)

    Q) 1월부터 3월까지 모임을 개최하고 가장 많이 참석했던 사람에게 선물을 주기로 했을 때, 누가 모임에 몇 번 왔는지 어떻게 구할까?

     

    1) 먼저 1월 부터 3월까지 참석자 명단을 월 구분 없이 모두 합친다.

    (참석자 중 동명이인이 있을 것을 고려하여 핸드폰 번호를 같이 가져왔다)

     

    (before)

    1월 참석자 명단

    김초록 010-1111-1111
    김초록 010-2222-2222
    최노랑 010-3333-3333
    박빨강 010-4444-4444
    조하얀 010-1234-1234

    2월 참석자 명단

    김초록 010-1111-1111
    한분홍 010-5555-5555
    심보라 010-6666-6666
    이주황 010-7777-7777

    3월 참석자 명단

    김초록 010-1111-1111
    한분홍 010-5555-5555
    윤파랑 010-8888-8888
    정연두 010-9999-9999
    조하얀 010-1234-1234
    박자주 010-5678-5678
    김초록 010-2222-2222

    (after) 아래와 같이 월 구분 없이 참석자 명단을 모두 합친다

    김초록 010-1111-1111
    김초록 010-2222-2222
    최노랑 010-3333-3333
    박빨강 010-4444-4444
    조하얀 010-1234-1234
    김초록 010-1111-1111
    한분홍 010-5555-5555
    심보라 010-6666-6666
    이주황 010-7777-7777
    김초록 010-1111-1111
    한분홍 010-5555-5555
    윤파랑 010-8888-8888
    정연두 010-9999-9999
    조하얀 010-1234-1234
    박자주 010-5678-5678

     

    2) 모여진 명단에서 이름과 전화번호를 합쳐 새로운 구분자를 만든다.

    이는 동명이인을 구분하기 위한 것으로 이름과 전화번호가 모두 일치할 경우에만 같은 사람인 것으로 한다. (예. 1월 참석자 중 김초록이란 이름이 2명 있는데 핸드폰 번호가 다르므로 이는 다른 사람이다. 이제부터는 합친 문자열만 가지고 편집할 예정)

     

    3) 합친 문자열 옆 칼럼에 1을 각각 넣는다.

    (나중에 이름&전화번호별로 SUM을 하기 위한 사전 작업)

     

    4) 두 컬럼을 잡고 Pivot 테이블을 만든다.

     

    5. 합친 문자열 컬럼은 Row Labels에, 1넣은 컬럼은 Values에 넣는다. 

     

    6. B열에 각각 참석자의 방문 횟수가 나왔다. 많이 방문한 순서대로 보려면, B열 첫번째 데이터를 잡고 내림차순 정렬하기

     

    7. 010-1111-1111번호를 가지신 김초록님이 3회 방문으로 제일 많이 방문했음을 알 수 있다. 

    - 끝 -

    '전공 > DATA' 카테고리의 다른 글

    [SPSS] SAV파일 TXT로 뽑기  (0) 2020.03.07
    [EXCEL] RANDBETWEEN 함수  (0) 2020.02.19
    [EXCEL] COUNTIF 특정 글자 카운트하기  (0) 2020.02.09
    [EXCEL] VLOOKUP & IFERROR  (0) 2020.02.08
    [SPSS] SORT CASE 오름차순 내림차순 정렬하기  (0) 2020.02.01

    댓글