top of page
Mastering Data Analytics
Blog nổi bật
Tất cả bài viết


Phân tích rời bỏ khách hàng (Customer Churn): Dữ liệu nói gì trước khi họ rời đi?
Bạn có đang đánh mất khách hàng mà không hề hay biết? Dữ liệu là “tiếng nói thầm lặng” tiết lộ điều đó — nếu bạn biết cách lắng nghe. Trong bài viết này, MDA chia sẻ một bộ dữ liệu thực tế từ ngân hàng chuyên dùng để phân tích hành vi rời bỏ của khách hàng (Customer Churn), kèm theo dashboard mẫu trực quan giúp bạn dễ dàng luyện tập và triển khai trong thực tế. Giới thiệu bộ dữ liệu Bank Customer Churn Tên file: Bank_Churn.csv Số dòng: 10.000 khách hàng Thuộc tính chính:
27 thg 102 phút đọc


Superstore Sale Dataset: Bộ dữ liệu mô phỏng kinh doanh bán lẻ chuẩn thực tế
Superstore Sale Dataset là một trong những bộ dữ liệu mẫu được sử dụng phổ biến nhất trong các khóa học về Phân tích dữ liệu và Business Intelligence (BI) . Với dữ liệu bán lẻ mô phỏng thực tế, cấu trúc rõ ràng, giàu thông tin và dễ thao tác, đây là bộ dữ liệu lý tưởng cho người mới bắt đầu luyện kỹ năng phân tích từ cơ bản đến nâng cao. Tổng quan về Superstore Sale Dataset Số lượng bản ghi : ~10.000 dòng Cấu trúc dữ liệu gồm : Đơn hàng: Order ID, Order Date, Ship Date, Shi
27 thg 102 phút đọc


Phân Tích Dữ Liệu Khiếu Nại: Doanh Nghiệp Cần Lắng Nghe Khi Khách Hàng Lên Tiếng
Khi khách hàng chủ động phản ánh – đó không chỉ là dữ liệu thô , mà là tiếng nói thật từ trải nghiệm chưa được giải quyết . Khác với các bảng khảo sát dễ bị thiên lệch, khiếu nại khách hàng là một trong những nguồn dữ liệu đáng tin cậy nhất để hiểu điều gì đang thực sự diễn ra trong hành trình khách hàng. 1. Tổng quan bộ dữ liệu khiếu nại khách hàng Bộ dữ liệu dưới đây tổng hợp hàng trăm nghìn khiếu nại từ người tiêu dùng gửi tới các công ty tài chính tại Mỹ – bao gồm: Thẻ
27 thg 102 phút đọc


Call Centre Performance Dataset: Bộ dữ liệu phân tích hiệu suất tổng đài
1. Call Centre Performance Dataset là gì? Call Centre Performance là một bộ dữ liệu thực tế, mô phỏng hoạt động của trung tâm chăm sóc khách hàng tại Mỹ trong giai đoạn 2020–2021. Dataset này đi kèm với một báo cáo dashboard minh họa trực quan, được chia sẻ công khai bởi chuyên gia Naresh Suglani trên nền tảng Tableau Public. 2. Có gì trong bộ dữ liệu này? Dữ liệu bao gồm hơn 10.000 cuộc gọi được ghi nhận theo từng bang, từng giờ, từng agent xử lý, cùng nhiều chỉ số vận hành
27 thg 102 phút đọc


World Energy Dataset: Bộ dữ liệu phân tích Năng lượng và Carbon toàn cầu
1. World Energy Dataset là gì? World Energy Dataset là bộ dữ liệu mở gồm hơn 80.000 bản ghi về sản lượng, tiêu thụ năng lượng (Oil, Coal, Gas, Hydro, Wind, Solar) và phát thải CO₂ của 190 quốc gia trong giai đoạn 1964 – 2024 . Bộ dữ liệu được biên soạn và duy trì bởi dự án Our World in Data (OWID) , phát hành trên GitHub dưới giấy phép CC-BY . 2. Có gì trong bộ dữ liệu này? Năng lượng: Sản lượng/tiêu thụ Oil, Coal, Gas, Hydro, Wind, Solar (TWh). Phát thải: Tổng CO₂ và C
27 thg 102 phút đọc


Customer Support Dataset – Phân tích dữ liệu hỗ trợ khách hàng trong 12 tháng thực tế
Bạn đang muốn luyện phân tích dữ liệu thực tế về dịch vụ khách hàng?Bạn cần một bộ dữ liệu có đầy đủ yếu tố để thực hành từ làm sạch, trực quan hóa, đến storytelling theo chuẩn Business Intelligence? Customer Support Dataset sẽ giúp bạn làm được điều đó – với 12 tháng dữ liệu chăm sóc kỹ thuật từ một công ty SaaS, có phân loại ảnh hưởng (impact level), thời gian xử lý và trạng thái case. Về bộ dữ liệu Customer Support Dataset Bộ dữ liệu mô phỏng toàn bộ hệ thống hỗ trợ khách
27 thg 103 phút đọc


Nike Performances Dataset: Giải mã chiến lược vận hành và mở rộng toàn cầu qua dữ liệu
Làm thế nào để một thương hiệu thể thao như Nike xây dựng đế chế toàn cầu? Với bộ dữ liệu Nike đa chiều, bạn có thể khám phá hành trình này thông qua các chỉ số về sản phẩm, tài chính, sản xuất và cổ phiếu – được thu thập trong giai đoạn 2017–2022. 1. Tổng quan về bộ dữ liệu Nike Performances Bộ dataset bao gồm: Thông tin sản phẩm: loại sản phẩm, giá bán, rating khách hàng, tình trạng tồn kho… Dữ liệu tài chính: doanh thu theo khu vực, chi phí, lợi nhuận, biến động cổ phiếu…
27 thg 102 phút đọc


Dataset thực tế mô phỏng quy trình Supply Chain: Đặt hàng, Nhận hàng và Xuất bán
Bạn đang tìm kiếm một bộ dữ liệu thực tế để luyện phân tích chuỗi cung ứng bằng Power BI ? Hầu hết các file mẫu đều đơn giản, ít chiều dữ liệu và không phản ánh được dòng vận hành thực trong doanh nghiệp. Nhưng với bộ dataset “Purchase ➝ Inventory ➝ Sales” dưới đây, bạn sẽ có cơ hội thực hành như đang xử lý dự án BI nội bộ thực thụ – bao gồm cả phức tạp về thời gian, dữ liệu rời rạc, và không có khóa liên kết. Giới thiệu về bộ dataset File: Data Challenge 7.xlsx Định dạng: E
27 thg 103 phút đọc


Digital Ads Performance – Bộ dataset giải mã hiệu suất quảng cáo đa kênh!
Bạn đang tìm một bộ dữ liệu chất lượng cao để luyện kỹ năng phân tích marketing, tối ưu phễu chuyển đổi và chứng minh ROI? Digital Ads Performance Dataset là lựa chọn lý tưởng – giúp bạn mổ xẻ từng đồng chi phí quảng cáo, so sánh hiệu suất giữa các kênh như Google, Meta, YouTube, Naver… và trực quan hóa toàn bộ hành trình khách hàng từ Click đến Purchase. Về bộ dữ liệu Digital Ads Performance Dashboard được thiết kế để: So sánh hiệu quả của các kênh quảng cáo khác nhau Theo
27 thg 102 phút đọc


Phân tích mức lương ngành dữ liệu với Data Science Job Salaries
Bạn đang tìm một tập dữ liệu chất lượng để luyện phân tích?Bạn muốn trực tiếp bóc tách mức lương ngành dữ liệu theo từng vị trí, cấp bậc, quốc gia? Data Science Job Salaries là một tập dữ liệu công khai đã được xử lý và làm sạch, rất phù hợp để thực hành phân tích, thiết kế dashboard, và xây dựng portfolio cá nhân trong lĩnh vực dữ liệu. 1. Tổng quan về dataset Nguồn: Hugging Face Thời gian: Giai đoạn 2020–2022 Số dòng dữ liệu: 607 bản ghi đã được làm sạch Phạm vi phân tích:
27 thg 102 phút đọc


Retail Analytics Dataset – Khám phá chân dung khách hàng từ dữ liệu kinh doanh bán lẻ thực tế
Phân tích khách hàng luôn là bài toán hàng đầu để tối ưu hóa ngân sách và tăng lợi nhuận cho doanh nghiệp bán lẻ. Bạn có bao giờ tự hỏi liệu giảm giá 50% có thực sự thu hút khách hàng mua nhiều hơn, hay chỉ đơn giản là “đốt” tiền mà chẳng thay đổi hành vi của họ? Retail Analytics Dataset chính là giải pháp thực tế và hiệu quả, cung cấp cho bạn những con số chính xác thay vì những phỏng đoán cảm tính. Retail Analytics Dataset gồm những thông tin giá trị gì? 1. Phân khúc khách
27 thg 103 phút đọc


Supply Chain Dataset: Thực Hành Phân Tích Chuỗi Cung Ứng Từ Đầu Đến Cuối
Bạn đang học Power BI, muốn luyện tập phân tích dữ liệu thực tế nhưng lại chỉ tìm thấy các file bán hàng hoặc marketing đơn giản? Bộ dữ liệu Supply Chain dưới đây là một trong số hiếm những file có thể mô phỏng trọn vẹn hành trình của chuỗi cung ứng :Từ đặt hàng (Order) ➝ xử lý & giao hàng (Fulfillment) ➝ đến khách nhận hàng (Delivery) Tại sao file này đặc biệt? Không giống như các file Excel mẫu đơn giản, dataset này có cấu trúc đa chiều, giúp người học luyện tập toàn bộ
27 thg 103 phút đọc


Technical Support Dataset – Bộ dữ liệu đánh giá hiệu quả đội hỗ trợ kỹ thuật từ A đến Z
Bạn đang tìm một bộ dữ liệu giúp thực hành phân tích vận hành và đánh giá hiệu suất đội hỗ trợ kỹ thuật? Bộ Technical Support Dataset cung cấp hơn 2.300 yêu cầu hỗ trợ (ticket) , giúp bạn mô phỏng chính xác quy trình xử lý từ lúc tiếp nhận đến khi đóng ticket – với đầy đủ chỉ số về SLA, mức độ ưu tiên, mức độ hài lòng của khách hàng, và nhiều hơn thế. 1. Giới thiệu bộ dữ liệu Technical Support Dataset mô phỏng hoạt động của một trung tâm hỗ trợ kỹ thuật, với hơn 2.300 ticke
27 thg 102 phút đọc


Phân tích OEE – Dataset sản xuất thực tế cho người học BI
Nếu bạn đang học Power BI và muốn luyện phân tích trong ngành sản xuất, nhưng không biết bắt đầu từ đâu, thì file này chính là lựa chọn phù hợp để bắt đầu. Khác với các bài tập “kéo-thả cho đẹp”, file Power BI này mô phỏng một tình huống thật: cách nhà máy theo dõi hiệu suất máy móc thông qua chỉ số OEE (Overall Equipment Effectiveness). OEE là một chỉ số quan trọng trong ngành sản xuất, phản ánh hiệu suất tổng thể của thiết bị dựa trên 3 yếu tố: Availability – mức độ sẵn s
27 thg 102 phút đọc


Dataset Learning Portal: Thực hành Learning Analytics với Dashboard Power BI
Trong lĩnh vực Data Analytics và Business Intelligence , việc thực hành với dữ liệu thực tế là cách nhanh nhất để nâng cao kỹ năng. Một trong những dataset tiêu biểu chính là 365 Learning Portal Dataset , phản ánh hành vi học tập và kết quả của hàng chục ngàn học viên trên một nền tảng trực tuyến. Bộ dữ liệu này phù hợp cho những ai muốn luyện tập xây dựng dashboard phân tích học tập (Learning Analytics Dashboard) bằng Power BI hoặc Tableau. 1. Nội dung dataset Dataset bao g
27 thg 103 phút đọc


Global CO₂ Dataset – Bộ dataset 3 trong 1 để đọc vị phát triển bền vững
Dữ liệu kinh điển để phân tích kinh tế – môi trường Trong bối cảnh biến đổi khí hậu trở thành vấn đề sống còn, các con số về dân số, GDP và khí thải CO₂ không chỉ còn là dữ liệu thống kê, mà đã trở thành “thước đo” cho mức độ phát triển bền vững của nhân loại.Bộ dataset này tổng hợp từ World Bank và Our World in Data, thường được cộng đồng Tableau và Power BI dùng để xây dựng những dashboard khí hậu trực quan, giúp đặt lại câu hỏi: Liệu tăng trưởng có thể đi cùng xanh hóa?
27 thg 104 phút đọc


Học Phân Tích Nhân Sự? Đây là dataset chuẩn để luyện dashboard BI
Trong phân tích dữ liệu nhân sự (HR Analytics), việc tìm kiếm một bộ dataset giả lập có đủ chi tiết, phù hợp với thực tế doanh nghiệp để thực hành dashboard luôn là bài toán khó. Trong bài viết này, Mastering Data Analytics xin chia sẻ một bộ dataset đặc biệt: Employee/HR Dataset (All in One) – đủ để xây dựng một dashboard nhân sự đầy đủ tính năng, gần 97% với dashboard thực tế trong doanh nghiệp. Dataset chi tiết Nguồn: Kaggle Link tải: tại đây Loại file: CSV Mô tả: Ba
27 thg 102 phút đọc


KPI Dataset – Bộ thực hành kinh điển cho Sales, Marketing, Customer & Profit Analysis
Bạn muốn luyện kỹ năng phân tích kinh doanh, dựng dashboard chuẩn Business Intelligence (BI) và biến dữ liệu rời rạc thành bức tranh toàn cảnh? KPI Dataset chính là bộ dữ liệu “chuẩn bài” giúp bạn rèn luyện từ A-Z các kỹ năng phân tích KPI: Sales, Customers, Profit, AOV, ARPPU. 1. Thông tin về Dataset Nguồn: Kaggle Link tải: tại đây Định dạng: CSV, dễ dàng mở bằng Excel, Power BI, Tableau. Kích thước file: ~10.000 dòng dữ liệu. Thời gian: Ghi nhận theo từng tháng, có thể
27 thg 102 phút đọc
bottom of page












