아비나쉬 카우쉭의 웹 데이터 분석학 후기 (2)

8 minute read

3장. 클릭스트림 분석의 놀라운 세계 : 측정 지표

3장을 읽으면서 가장 크게 느꼈던 부분은 우선 번역에 대한 아쉬움 이다. 사실 2장까지의 내용이 그냥 커피라면, 3장부터가 본격적인 T.O.P 같은 느낌이었는데, 아무래도 에세이나 소설과는 다른 분석에 대한 내용인만큼 단어의 미묘한 차이가 읽는 속도를 저하시켰다.

3장의 주요 내용은 웹 측정 지표를 설명하고, 지표 선정과 웹 데이터 분석에 대한 일종의 팁을 주는 느낌이었다. 3장의 초반부에서 설명한 웹 분석 지표들은 아래와 같다.

  1. 방문과 방문자(Visit, Visitor)
  2. 페이지 체류 시간, 사이트 체류 시간
  3. 반송률(Bounce Rate)
  4. 이탈율(Exit Rate)
  5. 전환율
  6. 인게이지먼트(Engagement)

대부분의 지표는 기존에 아는 내용이라 새로이 정리할만한 건 없었고, 여러 개의 지표들 중 새로웠던 부분은 ‘6. 인게이지먼트’이다.

인게이지먼트의 경우, 책에서의 정의는 ‘호의적인 관심 또는 흥미를 이끌어 내는 것’이라고 적혀있는데, 웹 데이터 분석에서 인게이지먼트라는 용어는 제각기 다른 용도로 쓸 수 있어 주의가 필요하다고 한다. 분석의 세계에서 이 인게이지먼트를 측정하는 것은 불가능할 정도로 매우 어렵다고 하는데, 아비나쉬 카우쉭이 제안하는 인게이지먼트를 대한 일종의 태도(?)는 아래와 같다.

  • 인게이지먼트가 뜻하는 바는 ‘정도’이지 ‘종류’가 아니다.
    • 여기서 종류의 예시는 다음과 같다. A라는 사람이 뉴욕사이트 웹 사이트에서 원하던 뉴스를 보며 10분을 보낸 것과, B라는 사람이 원하던 뉴스를 찾지 못해 9분을 보낸 것은 체류 시간 측면에서 인게이지먼트는 비슷할지 모르지만, 인게이지먼트의 종류는 다르다. A는 10분 동안 긍정적인 인게이지먼트를, B는 9분동안 부정적인 인게이지먼트를 얻은 경험을 했다고 하는 것이 맞을 것이다. 그리고 당연히, 웹 데이터만으로는 이 사람의 인게이지먼트가 긍정인지 부정인지 판단할 수 없다. 따라서 우리가 측정하는 것은 인게이지먼트의 ‘정도’만 측정하는 것이다.

인게이지먼트를 놓고 의사 결정권자와 논의할 때는 위와 같은 ‘정도’에 대한 언급을 반드시 해주는 것이 좋다고 한다. 오해의 소지가 있기 때문이다.

웹 사이트 방문자의 인게이지먼트를 측정하는 아이디어를 다음과 같이 제시해주었다.

  • 페이지 별 출구 설문조사
    • 앱을 사용하다보면 앱 종료 직전에 사용 경험을 별표로 물어보는 경우가 많았는데, 유저의 인게이지먼트 측정이 목표라는 생각이 들었다. 어디다가 쓸데가 있으니 물어보는 거겠지라고 생각했는데, 막연히 추상화 되어 있던 개념이 정확한 단어를 만나 형체화 된 기분이다.
  • 추천 가능성을 지표로 측정하는 설문 조사와 같은 간접정 방식을 고려하라
    • 첫 번째 경우와 유사한 것 같다. 다른 사람에게 추천할 의향이 있으십니까? 와 같은 질문일 것 같다. 구글이나 마이크로소프트 제품을 사용하다보면 만날 수 있다.
  • 장기적으로 서비스를 오래 사용하는 고객들,혹은 지속적으로 구매하는 사람들의 데이터를 이용할 것
    • 분석 컨설턴트 입장에서 고객사의 웹 로그를 분석한다면 활용할 수 있는 가장 좋은 방법인 것 같다. 대용량 데이터에 대한 문제에 부딪히겠지만…

웹 분석 지표는 행동을 유도해야하고, 행동을 유도하기 위해서는 결국 타인에게 잘 전달 되어야 한다. 때문에 이해하기 쉬워야 하는데, 이를 비롯해서 훌륭한 측정 지표의 네 가지 속성이 아주 인상 깊었다.

  1. 복잡하지 않다.
  2. 회사의 사업과 연관이 있어야 한다.
  3. 시기적절하게 결과를 확인할 수 있어야 한다.
    • 실시간으로 까지는 아니더라도, 현재 상태의 분석 결과를 확인하려면 2~3달이 걸려서는 안된다는 뜻이다.
  4. 즉시 유용해야 한다.
    • 측정 지표를 보는 즉시 바로 이해할 수 있어야 하고, 보는 즉시 인사이트를 얻을 수 있는 형태여야 한다는 뜻이다.

위 4가지를 만족하는 예로 반송률(Bounce Rate)가 있다. 복잡하지 않고, 웹 분석에서는 거의 항상 중요하며, 결과 확인도 어렵지 않고, 반송률이 높다면 보는 즉시 심각함을 느낄 수 있다.

아비나쉬 카우쉭이 웹 데이터 분석 과정에서 얻은 교훈도 총 3가지로 적혀 있다.

  1. 웹에서 데이터의 품질은 완벽하게 만들기 힘드므로, 완벽함에 지나치게 신경쓰지 않아야 한다.
  2. 핵심적인 측정 지표를 찾아야 한다.
    • 그로스 해킹에서 흔히 얘기하는 북극성 지표(North Star Metric) 같은 것을 의미하는 것 같다.
  3. 웹 측정 지표의 생애 주기 프로세스는 분석가의 친구이다.
    • 번역이 약간 어색하다고 느껴지는 부분 중에 하나인데, 주요 내용은 측정 지표의 ‘정의-측정-분석-결정-개선 또는 제거’ 싸이클을 계속 반복하여 지표를 정의하고 제거하고 하는 과정을 주기적으로 반복해야 한다는 뜻이다.

4장. 멋진 클릭스트림 분석의 세계 : 실용적인 해결책

(번역이 점점 다 아쉬워 지고 있다…)

웹 데이터 분석 입문

웹 데이터를 분석하는 간편한 도구를 사용할 때, 아비나쉬 카우쉭은 다음과 같은 순서로 지표를 보는 것을 추천한다.

  • 이것은 무엇인가? : 리포트에 적힌 것을 이해하는 단계
  • 무엇을 말하고 있는가? : 지표와 정보를 해석하는 법을 인지
  • 다음에 해야 할 일은 무엇인가?
  • 중요한 것은 무엇인가?

위 지표들을 사용하는 예시를 들어주었는데, 몇 가지의 예시는 기존에 알고 있던 내용이라 새롭지 않았고, 기억에 남는 예시를 정리해서 옮겨보겠다.


(이미지 출처 : https://www.michaelwhitaker.com/2010/07/12/visits-to-purchase-revisited-in-google-analytics/)


visit to purchase는 막연하게 알고 있던 개념인데, 한 번의 구매까지 몇 번의 방문을 하는지 현황을 보여주는 리포트이다. 이미지의 1 visit 에 77.49%의 수치가 기록되어있는데, 이 의미는 첫 번째 방문 시 구매하는 경우가 전체 구매 수 중 78%에 해당하는 것을 의미한다. (첫 번째 방문에 이렇게 구매를 하는 경우가 많은 것은 굉장히 의아한 일인데, 그 이유는 이미지 상의 from start of last campign 문구와 연관이 있다. 이 부분은 적고자 하는 책의 내용과 달라 딱히 적진 않겠지만, 이미지 출처의 포스팅을 참고하면 해당 설명을 볼 수 있다.)

이러한 의미를 가지고 있는 리포트가 visit to purchase 이라는 뜻정도로만 사용하려 한다. 아비나쉬 카우쉭이 제안한 순서대로 보면 위 리포트는 이런식으로 해석할 수 있다.

  • visit to purchase는 무엇인가? : 웹 사이트 분석 도구는 유저의 첫 번째 방문부터 쿠키 등을 기반으로 하여 유저마다 고유한 식별자를 붙인다. 때문에, 이 유저의 첫 번째 방문부터 기록할 수 있는데(물론 쿠키 삭제나 디바이스를 여러 개 사용하는 등의 이슈로 정확히 측정할 수 없다.) 위에서 언급한 바와 같이 한 번 구매하는데 있어 몇 번 방문 하는지 현황을 보여준다. 일반적인 전자상거래에서는 구매가 기준이 되겠지만, 전환율도 그러하듯 구매라는 목적을 다른 회원 가입 등의 다른 목적으로 바꿔도 상관은 없을 것 같다.

  • 무엇을 말하고 있는가? : 이미지 상으로는 첫 번째 방문에서 전체 구매 중 77%가 발생하고 있다. 물론 이 부분에서 이상한 것을 찾고 드릴 다운해서 심화 분석을 시작할 수도 있다. 보통 상품이 고가일수록 사람들이 더 고민하고, 가격 비교도 더 많이 할테니 visits to purchase 리포트에서 높은 방문 수의 구매 비율이 더 높지 않을까 생각해볼 수도 있다.

  • 다음에 해야할 일은 무엇인가? : visits to purchase 이외에도 days to purchase도 있는데, 이는 한 번 구매할 때까지 몇 일이나 지나는지를 뜻한다. 책에서는 두 개의 리포트를 활용하면, 좀 더 다각적인 분석을 할 수 있다고 이야기한다.

  • 중요한 것은 무엇인가? : visit to purchase와 days to purchase 리포트를 통해 상황을 파악하는 것은 그리 오래 걸리지 않는 일이니, 여기서 얻어낸 정보를 통해 데이터 간의 상관 관계를 도출하거나 판매 전략을 이용해 조금 더 실무적으로 접근해 볼 수 있다.

이러한 접근 방법은 완전히 새로운 건 아니지만, 단계를 나누고, 조금 더 의식해서 하니까 생각이 깔끔하게 정리가 되는 듯 하다.

총합이 아닌 고객 행동 주시하기

방문 수 나 페이지 뷰수 같은 ‘총합’이 아닌, 고객의 행동에 관한 지표를 주의 깊게 살펴보라는 의미이다. 고객의 행동에 관한 지표의 예시로는 depth of visit을 예시로 들었다.


(이미지 출처 : https://www.kaushik.net/avinash/i-got-no-ecommerce-how-do-i-measure-success/)


1회 방문 시에 몇 번의 페이지 뷰를 발생 시키는지 확인하는 이 수치는, 유저의 활동성 정도를 확인할 수 있다고 볼 수 있겠다.(이외에도 고객의 행동을 표현하는 지표로 이미지의 출처를 참고 하면 좋을 것 같다. 구글링해서 들어갔는데 알고보니 저자의 홈페이지 였다.)

일 단위 클릭스트림 분석 결과를 업무에 반영

다음 단계로 제시하는 것은 아래 5가지 항목슬 살펴보는 것이다.

  • 내부 사이트 검색 분석
  • 검색 엔진 최적화
  • 유료 검색
  • 직접 유입
  • 이메일 캠페인

내부 사이트 검색 분석

웹 클릭 분석에서 많이 놓치는 부분 중에 하나가 유저의 의도를 파악하는 것이다. 이전 파트에서 얘기했던 페이지 뷰가 많은 상위 10개의 페이지만으로는 유저의 의도가 어떤 것인지 정확하게 파악할 수 없다.

내부 사이트 검색 분석 시 주목해야 할 부분은 아래 2가지 이다.

  1. 검색 기능이 얼마나 많이 활용되는가?
  2. 어떤 키워드가 가장 많이 사용 되는가?

위 2가지를 활용해 유저들의 의도를 파악했으면, 이번에는 사이트 내에서 실제로 유저들이 검색 당시 원하던 목적을 달성하는지 확인이 필요하다.

이를 책에서는 검색 이탈(Search Exits)로 제시하고 있다. 반송율과 동일한 현상을 측정하는데, 내부 사이트 검색 엔진에서 제공 된 결과를 살핀 후 곧 바로 웹사이트를 떠나는 비율을 알 수 있다.

검색 엔진 최적화(SEO) 분석

온라인에서 사업 행위를 하는 대부분의 사이트 들이 그러하듯이 검색 엔진 상에서 자사의 서비스를 노출할 수 있는 환경을 조성하는 것은 매우 중요하다. 마케팅 적인 영역이 섞여 있어서 다소 이해하기 어려웠으나, 무료 검색과 유료 검색을 세분화의 시작으로 분석의 물꼬를 트는 아이디어를 제시하는 것 같다.

무료 검색의 경우 신경 써야 할 사항은, 유저들이 입력한 키워드에 적절하게 사이트의 컨텐츠들이 노출될 수 있어야 하는데, 이것을 적절하게 색인(index)이 달린 웹사이트를 갖는 것이라고 표현하고 있다. 그리고, 색인이 잘 달려있는지는 (미국의 기준으로) 웹 마스터 도구라는 것을 사용하도록 권장하고 있다.

검색 엔진 최적화가 되어있다면 GA 상에서 직접 유입 이외에 키워드를 통해 유입 되는 유저의 수나, 세션 수가 증가할 것이다.

이하 유료 검색과 직접 유입, 이메일 캠페인의 내용은 당장 나의 경우에 해당하지 않는 부분들이 많아 따로 정리하지 않는다.

현실 점검 : 주요 웹 데이터 분석 과제의 전망

방문자 추적 쿠키

쿠키(cookies)는 동일한 유저가 웹 사이트에 방문을 하는 사람들에게 일종의 식별자를 할당하는 작은 문서 파일이다. (동일 브라우저를 사용한다는 가정하에 동일 유저 여부를 확인할 수 있다)

일시적인 쿠키와 지속적인 쿠키

유저들에게 할당하는 쿠키는 크게 2가지 종류가 있는데, 일시적인(transient) 쿠키와 지속적인(persistent) 쿠키이다.

일시적인 쿠키는 웹 사이트에서 세션을 구분하는 역할을 한다. 유저가 사이트를 방문하면 쿠키가 설정되고, 이후 종료할 때 쿠키가 사라진다. 지속적인 쿠키는 유저가 처음 사이트에 방문한 순간부터 서비스를 사용하지 않는 순간에도 지속적으로(일정기간동안만) 유저에게 붙는다.

first party와 third party

일시적이거나 지속적인 것은 쿠키의 성격을 의미하는 것이고, first party와 third party는 쿠키의 유형을 뜻한다.

third party 쿠키는 사이트 방문 시에 제3자에 의해 설정되는 쿠키를 의미한다. 하지만 이 third party 쿠키를 거부하는 브라우저 설정, 일부 소프트웨어 프로그램으로 인해 제거되는 경우가 빈번하고, 이럴 경우, 유저를 정확히 추적할 수 없어 현재는 개별 방문자를 추적하는 차선책으로 여겨지고 있다.

따라서, 웹 사이트 자체의 도메인을 이용한 방법으로는 first party 쿠키를 이용한다. first party 쿠키는 재방문 추적이나 신규, 또는 재방문자 세분화에 뛰어나다.

쿠키 삭제

구글링을 하다 보면, 특히 외국 사이트에서 쿠키를 수집하는 것을 허락 받는 경우가 있다. 나 같은 경우에는 약간 찝찝해서 대부분은 거부하거나 무시한 채 원하는 정보를 찾는데, 이러한 요청에 거부를 하면 유저를 추적하기가 어려워 진다. 수집을 거부하거나, 삭제하거나 등 쿠키가 삭제 되는 이유는 사이트마다 매우 다양할 수 있다.

쿠키가 없어도, 삶은 지속된다.

쿠키가 있을 경우, 개별 방문자와 방문 같은 주요 지표를 더 정확하게 추적할 수 있겠지만, 쿠키가 없는 데이터에서도 여전히 유용한 가치를 얻을 수 있다.

히스토리 데이터의 가치

시간이 지나며 가치가 줄어드는 데이터

데이터는 시간이 지날 수록 가치를 잃어버린다. 수집한 첫 날 직후, 혹은 첫 달에는 유용하지만, 5개월 후에는 가치가 떨어지고, 1년 후에는 거의 무가치하다. 그 이유는 아래와 같다.

  1. 방문자가 너무 많이 변한다 : 방문자들의 브라우저, 기기 변경 등으로 인해 과거 유저의 사용 동향이나 패턴 파악은 유용성이 떨어짐
  2. 지표들을 연산하는 방식이 변한다.
  3. 시스템이 변한다
  4. 웹 사이트가 변한다

4장은 총 14장으로 구성되어 있는 이 책에서 약 80페이지를 차지할 정도로 양이 많은 분량이었다. 아쉽게도 아는 내용이 많았고, 모르는 내용은 접하더라도 당장의 분석 업무에서는 크게 활용될 부분이 아니었고, 오히려 마케팅 팀에서 알면 좋을 만한 지식들이었다. 물론 책을 읽었기에 이후에 언제든지 다시 필요할 때 떠올리고 찾아볼 수 있겠지만, 4장을 읽는데 꽤 오랜 시간을 할애한 것치고 배운 정보가 많지는 않았던 것 같다.