Chuyển tới nội dung chính

Cohort Analysis — Phân Tích Nhóm Người Dùng

📚 TÀI LIỆU TRAINING NỘI BỘ MANGOADS


1. Mở Đầu — Aggregate Data Đang Che Giấu Sự Thật

Hãy tưởng tượng: báo cáo tháng cho thấy retention rate trung bình của website là 25%. Con số này có vẻ ổn. Nhưng khi tách ra theo từng tháng acquire khách hàng, bức tranh hoàn toàn khác:

  • Khách hàng acquire tháng 1: retention 35% sau 3 tháng
  • Khách hàng acquire tháng 3: retention 18% sau 3 tháng
  • Khách hàng acquire tháng 5: retention chỉ còn 12%

Retention đang sụt giảm nghiêm trọng — nhưng con số trung bình 25% không hề phản ánh điều đó. Đây chính là bẫy của aggregate data: nó trộn lẫn mọi thứ lại với nhau và cho bạn một bức tranh mờ nhạt, thậm chí sai lệch.

Cohort analysis là phương pháp phân tích giải quyết chính xác vấn đề này. Thay vì nhìn tất cả người dùng như một khối đồng nhất, cohort analysis chia họ thành các nhóm (cohort) dựa trên đặc điểm chung — thường là thời điểm họ bắt đầu sử dụng sản phẩm — rồi theo dõi hành vi của từng nhóm qua thời gian.

Kết quả? Bạn nhìn thấy được:

  • Chất lượng khách hàng acquire mỗi giai đoạn đang tăng hay giảm
  • Chiến dịch marketing nào mang về khách hàng gắn bó lâu dài
  • Thời điểm churn xảy ra nhiều nhất để can thiệp kịp thời
  • CLV (Customer Lifetime Value) thực sự theo từng nhóm khách hàng

📌 Nguyên tắc MangoAds: Đừng tin aggregate average. Hãy tách nhóm, so sánh, rồi mới kết luận. Cohort analysis là kính hiển vi của data — nó phóng to những gì mà báo cáo tổng quan đang che giấu.


2. Phân Tích Chuyên Sâu

2.1. Cohort Analysis Là Gì — Bản Chất Và Tư Duy

Cohort (nhóm thuần tập) là một nhóm người dùng chia sẻ một đặc điểm chung trong một khoảng thời gian xác định. Cohort analysis là việc theo dõi và so sánh hành vi của các cohort này theo thời gian.

Ví von dễ hiểu: cohort analysis giống như việc một trường đại học theo dõi từng khóa sinh viên. Khóa 2020 có tỷ lệ tốt nghiệp bao nhiêu? Khóa 2021 thì sao? Thay vì tính trung bình tất cả sinh viên (vô nghĩa vì mỗi khóa có hoàn cảnh khác nhau), bạn so sánh từng khóa để thấy xu hướng.

Hai yếu tố cốt lõi của cohort analysis:

  1. Tiêu chí phân nhóm — Dựa trên cái gì để chia cohort? (thời gian, hành vi, nguồn traffic...)
  2. Metric theo dõi — Đo gì theo thời gian? (retention, revenue, frequency, conversion...)

2.2. Acquisition Cohorts — Phân Nhóm Theo Thời Gian

Đây là loại cohort phổ biến nhất và cũng là mặc định trong hầu hết các công cụ analytics.

Cách hoạt động: Nhóm người dùng theo thời điểm họ lần đầu tương tác (first visit, sign up, first purchase). Sau đó theo dõi hành vi của từng nhóm qua các khoảng thời gian tiếp theo (tuần 1, tuần 2, tháng 1, tháng 2...).

Ví dụ acquisition cohort theo tháng:

CohortTháng 0Tháng 1Tháng 2Tháng 3Tháng 4
Jan 20261.000 users (100%)320 (32%)210 (21%)180 (18%)150 (15%)
Feb 20261.200 users (100%)360 (30%)228 (19%)192 (16%)
Mar 2026900 users (100%)252 (28%)153 (17%)
Apr 20261.500 users (100%)375 (25%)

Đọc bảng này, bạn thấy ngay: retention Tháng 1 đang giảm dần từ 32% xuống 25%. Dù tổng số user tăng (Apr acquire 1.500), chất lượng user đang kém đi. Có thể do mở rộng targeting quá rộng, hoặc traffic source mới chất lượng thấp.

Acquisition cohort trả lời được các câu hỏi:

  • Chiến dịch marketing tháng nào mang về khách hàng chất lượng nhất?
  • Retention có đang cải thiện theo thời gian hay đang xấu đi?
  • Bao lâu thì khách hàng bắt đầu churn nhiều nhất? (week 1? month 2?)
  • Sản phẩm/dịch vụ mới có giúp giữ chân khách hàng tốt hơn không?

2.3. Behavioral Cohorts — Phân Nhóm Theo Hành Vi

Nếu acquisition cohort trả lời "Khi nào khách đến?", thì behavioral cohort trả lời "Khách đến làm gì?".

Cách hoạt động: Nhóm người dùng dựa trên hành động cụ thể họ đã thực hiện, rồi so sánh kết quả giữa các nhóm.

Ví dụ behavioral cohorts:

Behavioral CohortTỷ lệ mua hàngAvg. Order ValueRetention 3 tháng
Xem video sản phẩm12%850.000 VNĐ28%
Không xem video4%620.000 VNĐ11%
Dùng thử miễn phí22%1.200.000 VNĐ45%
Đọc 3+ bài blog9%780.000 VNĐ32%

Bảng trên cho thấy: người dùng thử miễn phí có retention gấp 4 lần người không xem video. Đây là insight cực kỳ có giá trị để quyết định đầu tư vào đâu.

Các loại behavioral cohort thường gặp:

  • Feature adoption cohort: Nhóm theo tính năng đã sử dụng
  • Engagement level cohort: Nhóm theo mức độ tương tác (power user, casual, dormant)
  • Channel cohort: Nhóm theo kênh traffic (organic, paid, referral, direct)
  • Content consumption cohort: Nhóm theo nội dung đã tiêu thụ
  • Purchase behavior cohort: First-time buyer vs repeat buyer vs lapsed buyer

2.4. Cohort Retention Table — Cách Đọc Và Phân Tích

Cohort retention table là công cụ trực quan hóa chính của cohort analysis. Đây là bảng tam giác (triangle table) mà mỗi hàng là một cohort, mỗi cột là khoảng thời gian sau acquisition.

Cấu trúc chuẩn:

Period 0 Period 1 Period 2 Period 3 Period 4
Cohort A 100% 40% 28% 22% 18%
Cohort B 100% 38% 25% 20%
Cohort C 100% 42% 30%
Cohort D 100% 35%
Cohort E 100%

3 hướng đọc retention table:

📌 Đọc theo hàng ngang (horizontal): Theo dõi một cohort cụ thể qua thời gian. Retention giảm nhanh ở giai đoạn đầu rồi ổn định là bình thường (natural churn curve). Nếu giảm đều đặn không chậm lại — sản phẩm có vấn đề.

📌 Đọc theo cột dọc (vertical): So sánh cùng một time period giữa các cohort. Nếu retention Period 1 ngày càng giảm qua các cohort mới — chất lượng acquisition đang kém đi. Nếu tăng — sản phẩm hoặc onboarding đang cải thiện.

📌 Đọc theo đường chéo (diagonal): Mỗi đường chéo đại diện cho cùng một thời điểm calendar. Nếu có sự thay đổi đột ngột trên đường chéo, có thể do một sự kiện bên ngoài (ra mắt tính năng mới, sự cố hệ thống, mùa mua sắm...).


2.5. Cohort Analysis Trong GA4

Google Analytics 4 tích hợp sẵn báo cáo cohort với khả năng tùy chỉnh mạnh mẽ.

Cách truy cập: Explore > Cohort exploration

Các thiết lập chính trong GA4:

  • Cohort inclusion criteria: Điều kiện để user thuộc một cohort (first visit, first purchase, any event...)
  • Return criteria: Hành động nào tính là "quay lại" (any event, specific event, purchase...)
  • Cohort granularity: Daily, weekly, monthly
  • Calculation: Standard (tỷ lệ so với cohort size) hoặc Rolling (tích lũy)

Ví dụ thiết lập thực tế:

Cohort inclusion: first_visit (tuần)
Return criteria: purchase event
Granularity: Weekly
Date range: Last 12 weeks

Thiết lập trên cho bạn thấy: trong số người lần đầu visit mỗi tuần, bao nhiêu % mua hàng ở tuần đó, tuần sau, tuần sau nữa...

⚠️ Lưu ý quan trọng với GA4:

  • GA4 cohort mặc định dùng user-level data, không phải session-level
  • Cohort size trong GA4 có thể bị ảnh hưởng bởi data thresholds (ẩn data nếu quá ít user)
  • GA4 free giữ data 14 tháng — cohort dài hạn cần BigQuery export
  • Kết hợp cohort exploration với segments để phân tích sâu hơn (ví dụ: cohort theo device, theo country)

2.6. Cohort Trong E-commerce — CLV By Cohort

Đối với e-commerce, cohort analysis mạnh nhất khi gắn với Customer Lifetime Value (CLV).

CLV by acquisition cohort:

CohortTháng 1 (cum. revenue/user)Tháng 3Tháng 6Tháng 12
Q1/2025 (Organic)250K480K720K1.100K
Q1/2025 (Paid Search)320K510K650K780K
Q1/2025 (Social Ads)180K270K310K340K

Insight từ bảng trên:

  • Organic có CLV ban đầu thấp nhưng tăng trưởng đều — khách hàng organic gắn bó lâu dài
  • Paid Search bùng nổ ban đầu nhưng chậm lại — có thể khách mua theo nhu cầu cấp bách, ít quay lại
  • Social Ads CLV thấp nhất — cần đánh giá lại targeting hoặc chấp nhận đây là kênh awareness, không phải revenue driver

Insight này thay đổi hoàn toàn cách bạn đánh giá hiệu quả marketing. Nếu chỉ nhìn ROAS tháng đầu, Paid Search thắng. Nhưng nhìn CLV 12 tháng, Organic mới là kênh sinh lời nhất.

💡 Bài học: Đừng đánh giá kênh marketing chỉ qua first-touch conversion. Cohort-based CLV cho bạn bức tranh thật sự về giá trị dài hạn của mỗi kênh.


2.7. Cohort Cho Subscription Businesses

Với mô hình subscription (SaaS, membership, gói dịch vụ), cohort analysis gần như là bắt buộc.

Các metric cohort quan trọng cho subscription:

MetricÝ nghĩaCách tính theo cohort
Retention rate% user còn active sau N thángActive users tháng N / Cohort size
Churn rate% user rời đi mỗi tháng1 - Retention rate
Net Revenue Retention (NRR)Revenue từ cohort tháng N / Revenue tháng 0Bao gồm upsell, downgrade, churn
Payback periodBao lâu để thu hồi CACCAC / (Monthly revenue per user × Retention rate)

Subscription cohort analysis thực tế:

Cohort Jan 2026 (100 subscribers, $50/tháng):
Tháng 0: 100 users → $5.000 MRR
Tháng 1: 82 users → $4.100 MRR (18% churn)
Tháng 2: 74 users → $3.700 MRR (10% churn)
Tháng 3: 70 users → $3.850 MRR (5% churn, có upsell)
Tháng 6: 62 users → $3.720 MRR
Tháng 12: 48 users → $3.360 MRR

→ Revenue retention tháng 12: 67.2% (user) nhưng NRR: 72% (do upsell)
→ CAC payback: ~3.5 tháng nếu CAC = $150

Dấu hiệu lành mạnh: Churn rate giảm dần qua các tháng (người ở lại lâu có xu hướng ở lại tiếp). Nếu churn rate không giảm hoặc tăng — sản phẩm đang không tạo được stickiness.


2.8. Cohort-Based Budgeting — Phân Bổ Ngân Sách Theo Cohort

Đây là ứng dụng nâng cao mà nhiều doanh nghiệp bỏ qua: dùng cohort data để quyết định phân bổ ngân sách marketing.

Nguyên tắc: Thay vì phân bổ ngân sách dựa trên ROAS ngắn hạn, hãy phân bổ dựa trên projected CLV by cohort.

Ví dụ cohort-based budgeting:

KênhCACCLV 6 tháng (cohort avg)CLV/CAC RatioBudget Decision
Google Search200K720K3.6x✅ Scale up
Facebook Ads150K310K2.1x⚠️ Maintain, optimize
TikTok Ads80K180K2.3x⚠️ Test thêm, cohort còn ngắn
SEO (Organic)50K*1.100K22x✅ Đầu tư dài hạn

CAC organic tính bằng chi phí SEO chia cho số khách hàng organic acquire

Bảng trên cho thấy: nếu chỉ nhìn CAC, TikTok Ads rẻ nhất. Nhưng nhìn CLV/CAC ratio, SEO cho ROI vượt trội — dù cần thời gian dài hơn.

Framework cohort-based budgeting 3 bước:

  1. Xây dựng cohort CLV table cho mỗi kênh (ít nhất 6-12 tháng data)
  2. Tính CAC payback period và CLV/CAC ratio cho từng kênh
  3. Phân bổ ngân sách ưu tiên kênh có CLV/CAC ratio cao nhất, đồng thời giữ ngân sách test cho kênh mới

3. Góc Nhìn MangoAds

Tại MangoAds, chúng tôi coi cohort analysis là nền tảng của mọi quyết định tối ưu, không phải là báo cáo nâng cao chỉ dùng khi cần.

Cách MangoAds triển khai cohort analysis cho khách hàng:

📌 Thiết lập tracking cohort-ready từ đầu: Khi setup GA4 và GTM cho khách hàng, team MangoAds luôn đảm bảo:

  • Event tracking đủ chi tiết để tạo behavioral cohort (không chỉ pageview, mà cả engagement events)
  • User ID hoặc Client ID mapping chính xác để theo dõi cross-session
  • UTM convention chuẩn hóa để phân cohort theo campaign/channel
  • BigQuery export từ GA4 cho khách hàng cần cohort analysis dài hạn

📌 Báo cáo cohort trong monthly report: Thay vì chỉ báo cáo metrics tổng hợp (traffic tăng X%, conversion tăng Y%), MangoAds bổ sung cohort view:

  • Retention by acquisition month: Khách acquire tháng này có gắn bó hơn tháng trước không?
  • CLV by channel: Kênh nào mang về khách hàng có giá trị dài hạn nhất?
  • Churn analysis: Thời điểm churn nhiều nhất, nguyên nhân có thể, và đề xuất can thiệp

📌 Tư duy "Cohort trước, Scale sau": Trước khi đề xuất tăng ngân sách bất kỳ kênh nào, MangoAds luôn kiểm tra cohort data. Kênh có volume lớn nhưng cohort retention thấp = scale lên sẽ lãng phí. Kênh có volume nhỏ nhưng cohort CLV cao = cơ hội scale thực sự.

💡 Câu nói hay từ team MangoAds: "Đừng đổ thêm nước vào xô thủng. Cohort analysis giúp bạn tìm ra xô nào đang thủng, thủng ở đâu, và đáng sửa hay nên đổi xô."


4. Ứng Dụng Thực Tế

4.1. Hướng Dẫn Đọc Cohort Table — Từng Bước

Giả sử bạn có cohort retention table sau cho một website e-commerce:

Cohort (tháng acquire)M0M1M2M3M4M5
Oct 20252.500 (100%)625 (25%)425 (17%)350 (14%)300 (12%)275 (11%)
Nov 20253.800 (100%)1.026 (27%)722 (19%)570 (15%)494 (13%)
Dec 20255.200 (100%)1.456 (28%)988 (19%)780 (15%)
Jan 20262.100 (100%)504 (24%)336 (16%)
Feb 20262.400 (100%)528 (22%)

Bước 1 — Đọc ngang (theo từng cohort):

Oct 2025: Mất 75% user ở tháng đầu, sau đó churn chậm lại. Đến M5 vẫn giữ 11%. Đây là cohort có retention khá stable sau initial drop.

Bước 2 — Đọc dọc (so sánh cùng period):

M1 retention: Oct (25%) → Nov (27%) → Dec (28%) → Jan (24%) → Feb (22%)

Nov và Dec có retention M1 tốt nhất — có thể do mùa mua sắm cuối năm, khách hàng engage hơn. Jan và Feb giảm rõ — khách hàng đầu năm ít gắn bó hơn, hoặc chiến dịch marketing đầu năm kém hiệu quả.

Bước 3 — Nhận insight hành động:

  • ⚠️ Vấn đề: Retention M1 đang downtrend (từ 28% xuống 22%). Cần xem lại chất lượng traffic acquire và onboarding experience.
  • Tín hiệu tốt: Từ M3 trở đi retention khá stable (14-15%). Những khách ở lại qua tháng 3 có xu hướng trung thành.
  • 💡 Action: Tập trung nurture trong 3 tháng đầu (email, retargeting, loyalty program) vì đây là giai đoạn quyết định.

4.2. Ví Dụ Phân Tích Cohort Theo Channel

Một khách hàng MangoAds trong ngành F&B online muốn biết nên đổ ngân sách vào kênh nào. Thay vì nhìn ROAS tháng, team phân tích cohort 6 tháng:

Kết quả:

  • Google Search Ads: Retention M3 = 22%, avg order frequency = 2.8 lần/quý. Khách hàng có intent mua rõ ràng, quay lại đều đặn.
  • Facebook Ads: Retention M3 = 8%, avg order frequency = 1.2 lần/quý. Khách mua lần đầu vì promo, ít quay lại.
  • Organic (SEO + Content): Retention M3 = 31%, avg order frequency = 3.1 lần/quý. Khách tìm hiểu kỹ trước khi mua, gắn bó nhất.

Quyết định: Giảm 30% budget Facebook Ads, chuyển sang đầu tư SEO content. Đồng thời tối ưu Facebook Ads tập trung vào lookalike audience từ nhóm khách organic (vì behavioral profile tương tự).

Kết quả sau 4 tháng: Overall retention M3 tăng từ 15% lên 21%, CLV trung bình tăng 35%.


5. FAQ — Câu Hỏi Thường Gặp

❓ Cohort analysis cần tối thiểu bao nhiêu data?

Không có con số cứng, nhưng thực tế cần ít nhất 3-6 tháng data với mỗi cohort có tối thiểu 100-200 users để kết quả có ý nghĩa thống kê. Cohort quá nhỏ sẽ bị ảnh hưởng bởi outliers.

❓ Nên dùng daily, weekly hay monthly cohort?

Phụ thuộc vào tần suất tương tác tự nhiên của sản phẩm:

  • Daily cohort: App có daily usage (tin tức, social, game)
  • Weekly cohort: E-commerce, SaaS tools dùng hàng tuần
  • Monthly cohort: Dịch vụ B2B, sản phẩm có chu kỳ mua dài

❓ Retention bao nhiêu là "tốt"?

Tùy ngành. Benchmark tham khảo cho M1 retention:

  • E-commerce: 20-30% là khá tốt
  • SaaS B2B: 80-90% (vì có contract)
  • Mobile app (non-game): 25-35%
  • Mobile game: 15-25%

Quan trọng hơn con số tuyệt đối là xu hướng: retention có đang cải thiện qua các cohort mới hay không.

❓ Có thể làm cohort analysis với Google Sheets/Excel không?

Hoàn toàn được. Bạn cần:

  1. Export raw data với user ID, first visit date, subsequent visit/purchase dates
  2. Dùng COUNTIFS hoặc Pivot Table để tạo cohort matrix
  3. Conditional formatting (heat map) để dễ đọc

Tuy nhiên, với dataset lớn (>10.000 users), nên dùng GA4 Cohort Exploration hoặc SQL trên BigQuery để đảm bảo chính xác và hiệu suất.

❓ Cohort analysis khác gì so với funnel analysis?

Funnel analysis theo dõi các bước trong một quy trình (visit → view product → add to cart → purchase) tại một thời điểm. Cohort analysis theo dõi một nhóm người qua nhiều thời điểm. Hai phương pháp bổ trợ nhau: funnel cho biết ở đâu khách rời bỏ, cohort cho biết khi nàonhóm nào rời bỏ nhiều nhất.


6. Key Takeaways

Aggregate data che giấu sự thật — Luôn tách nhóm (cohort) trước khi kết luận về retention, CLV, hay hiệu quả marketing.

Hai loại cohort chính: Acquisition cohort (phân theo thời gian acquire) và behavioral cohort (phân theo hành vi). Kết hợp cả hai cho insight mạnh nhất.

Đọc cohort table 3 chiều: Ngang (theo dõi một cohort), dọc (so sánh giữa các cohort), chéo (phát hiện sự kiện tác động).

CLV by cohort thay đổi cách đánh giá kênh marketing. Kênh có ROAS ngắn hạn cao chưa chắc mang về khách hàng có giá trị dài hạn. Organic thường thắng ở cuộc chơi dài.

Cohort-based budgeting giúp phân bổ ngân sách dựa trên giá trị thật, không phải cảm giác hay vanity metrics.

Với subscription business, cohort analysis là bắt buộc — theo dõi retention, churn, NRR theo cohort để phát hiện vấn đề sớm.

GA4 hỗ trợ cohort analysis native — tận dụng Cohort Exploration, kết hợp segments, và export BigQuery cho phân tích sâu.

📌 Lời kết từ MangoAds: Cohort analysis không phải công cụ phức tạp dành cho data scientist. Đó là tư duy phân tích mà bất kỳ marketer nào cũng cần có. Khi bạn bắt đầu nhìn data theo cohort, bạn sẽ không bao giờ muốn quay lại nhìn con số trung bình nữa.