[데이터 분석] e-commerce 데이터 분석-2
코호트 분석
클래식 코호트 분석
먼저 클래식 코호트 분석을 진행 해 보려고 합니다. 국회의원의 경우 2년, 6년 주기가 있어 임기 시작 날짜와 임기 종료 날짜를 적용해서 기간을 정했었습니다. 하지만 여기서는 종료라는 개념이 없으므로 단순히 고객의 첫 구매 날짜를 기준으로 기간을 설정했습니다. 또한 기간은 개월 단위 입니다!
첫 구매를 했을 때 사용자는 96096명입니다! 하지만 1개월이 지난 뒤 461명으로 대폭 감소를 했습니다. 왜 그렇게 큰 감소가 이어졌을까요?
재구매율 분석을 진행했을 때 낮았던 것처럼 재구매를 하는 사람이 적어 낮은 리텐션을 보이는 것 같습니다. 가장 주문율이 높았던 카테고리는 table이였습니다. 테이블은 자주 사는 상품이 아닌 주기가 긴 상품입니다. 브라질 Olist는 주로 주기가 긴 상품을 거래하는 웹이라서 이러한 형태를 가지고 있는 것일까요?
그래프를 보면서 어떤 전략을 세워야할까요? 두 가지 전략을 세울 수 있을 것 같습니다.
첫 번째, 초기에 이탈하는 고객의 수를 줄이려는 노력을 해야합니다.
두 번째, 초기 이탈하는 고객을 잡았다면 고객과의 관계를 유지하려는 노력을 해야합니다.
범위 리텐션 분석
이번은 클래식 리텐션 분석이 아닌 범위 리텐션 분석을 진행하려고 합니다.
위 히트맵은 연도-일자별로 상품을 구매한 고객의 리텐션을 살펴본 것입니다. (히트맵을 그릴 때 저는 이 색상을 가장 좋아하는데요, 깃허브를 가시면 관련 코드를 보실 수 있습니다..!!)
너무 범위가 좁으므로 이를 연도, 분기를 활용해서 리텐션 분석을 진행 해 보았습니다.
위 히트맵을 보시면 2017-01이 의미하는 것은 2017년도 1분기 고객들입니다. 이 고객들은 1개월이 지났을 때 리텐션이 0.39%를 보이네요. 그리고 4개월을 지났을 때 고객들의 리텐션이 아주 살짝 증가했습니다.
이번 프로젝트를 진행하며 느낀 점은 조금 더 다양한 범위의 실시간 데이터를 활용하고 싶다는 생각을 했습니다. 캐글이 제공하는 데이터이므로 가공되었으며, 특히 많은 정보 제공이 되지 않아, 특정 고객군을 추적할 수 없는 한계점이 있었습니다.
따라서 이렇듯 연습한 분석들을 실제로 적용하며 개선된 서비스를 제공 해 보고 싶습니다!!