top of page
Mastering Data Analytics
Blog nổi bật
Dataset & Outcome Sample


IT Helpdesk Dataset: Giải mã dữ liệu để tối ưu hóa quy trình
Một năm vận hành – hàng ngàn ticket – vô vàn câu chuyện đằng sau những con số tưởng chừng khô khan. Liệu bạn có thể nhìn vào một tấm hình và nghe được câu chuyện của cả một team IT? IT Helpdesk Dataset này không chỉ là tập hợp dữ liệu – mà là toàn bộ hành trình phục vụ, phản hồi, và cải tiến dịch vụ nội bộ trong suốt năm 2020.Từ số lượng ticket, thời gian phản hồi, tỷ lệ SLA, đến mức độ hài lòng của người dùng – tất cả đều được ghi lại và trực quan hóa để bạn có thể khai p
27 thg 102 phút đọc


Phân tích dữ liệu nghệ thuật với bộ dataset từ MoMA: Khi Data gặp Art
Bạn thích dữ liệu? Cũng yêu nghệ thuật?Bộ dữ liệu từ Museum of Modern Art (MoMA) chính là nơi hai thế giới này gặp nhau. MoMA dataset có gì đặc biệt? Đây là một kho dữ liệu mở với hơn 150.000 tác phẩm nghệ thuật . Nguồn gốc từ những tên tuổi lớn như Van Gogh, Picasso, Warhol, Matisse … Dữ liệu bao gồm: Tên tác phẩm, nghệ sĩ, năm sáng tác Chất liệu, kích thước, loại hình (hội họa, điêu khắc, nhiếp ảnh…) Quốc tịch, giới tính và trường phái nghệ thuật Không chỉ là dữ liệu – đây
27 thg 102 phút đọc


Transport & Shipping Dataset – Khi dữ liệu Logistics kể chuyện chiến lược
Hoạt động vận tải – giao nhận luôn ẩn chứa “kho vàng” dữ liệu. Bộ Transport & Shipping Dataset mô phỏng toàn bộ quy trình xuất – nhập khẩu của một doanh nghiệp logistics: từ đặt lệnh, đóng container, thông quan cho tới thu – chi và đo lường SLA. Đây là nguồn bài tập hoàn hảo cho người học Business Intelligence (BI) lẫn Data Analytics muốn luyện kỹ năng phân tích đa chiều kiểu “thực chiến” Tổng quan về Transport & Shipping Dataset Transport & Shipping Dataset mô phỏng hơn 5
27 thg 102 phút đọc


Phân tích rời bỏ khách hàng (Customer Churn): Dữ liệu nói gì trước khi họ rời đi?
Bạn có đang đánh mất khách hàng mà không hề hay biết? Dữ liệu là “tiếng nói thầm lặng” tiết lộ điều đó — nếu bạn biết cách lắng nghe. Trong bài viết này, MDA chia sẻ một bộ dữ liệu thực tế từ ngân hàng chuyên dùng để phân tích hành vi rời bỏ của khách hàng (Customer Churn), kèm theo dashboard mẫu trực quan giúp bạn dễ dàng luyện tập và triển khai trong thực tế. Giới thiệu bộ dữ liệu Bank Customer Churn Tên file: Bank_Churn.csv Số dòng: 10.000 khách hàng Thuộc tính chính:
27 thg 102 phút đọc


Superstore Sale Dataset: Bộ dữ liệu mô phỏng kinh doanh bán lẻ chuẩn thực tế
Superstore Sale Dataset là một trong những bộ dữ liệu mẫu được sử dụng phổ biến nhất trong các khóa học về Phân tích dữ liệu và Business Intelligence (BI) . Với dữ liệu bán lẻ mô phỏng thực tế, cấu trúc rõ ràng, giàu thông tin và dễ thao tác, đây là bộ dữ liệu lý tưởng cho người mới bắt đầu luyện kỹ năng phân tích từ cơ bản đến nâng cao. Tổng quan về Superstore Sale Dataset Số lượng bản ghi : ~10.000 dòng Cấu trúc dữ liệu gồm : Đơn hàng: Order ID, Order Date, Ship Date, Shi
27 thg 102 phút đọc


Phân Tích Dữ Liệu Khiếu Nại: Doanh Nghiệp Cần Lắng Nghe Khi Khách Hàng Lên Tiếng
Khi khách hàng chủ động phản ánh – đó không chỉ là dữ liệu thô , mà là tiếng nói thật từ trải nghiệm chưa được giải quyết . Khác với các bảng khảo sát dễ bị thiên lệch, khiếu nại khách hàng là một trong những nguồn dữ liệu đáng tin cậy nhất để hiểu điều gì đang thực sự diễn ra trong hành trình khách hàng. 1. Tổng quan bộ dữ liệu khiếu nại khách hàng Bộ dữ liệu dưới đây tổng hợp hàng trăm nghìn khiếu nại từ người tiêu dùng gửi tới các công ty tài chính tại Mỹ – bao gồm: Thẻ
27 thg 102 phút đọc


Call Centre Performance Dataset: Bộ dữ liệu phân tích hiệu suất tổng đài
1. Call Centre Performance Dataset là gì? Call Centre Performance là một bộ dữ liệu thực tế, mô phỏng hoạt động của trung tâm chăm sóc khách hàng tại Mỹ trong giai đoạn 2020–2021. Dataset này đi kèm với một báo cáo dashboard minh họa trực quan, được chia sẻ công khai bởi chuyên gia Naresh Suglani trên nền tảng Tableau Public. 2. Có gì trong bộ dữ liệu này? Dữ liệu bao gồm hơn 10.000 cuộc gọi được ghi nhận theo từng bang, từng giờ, từng agent xử lý, cùng nhiều chỉ số vận hành
27 thg 102 phút đọc


World Energy Dataset: Bộ dữ liệu phân tích Năng lượng và Carbon toàn cầu
1. World Energy Dataset là gì? World Energy Dataset là bộ dữ liệu mở gồm hơn 80.000 bản ghi về sản lượng, tiêu thụ năng lượng (Oil, Coal, Gas, Hydro, Wind, Solar) và phát thải CO₂ của 190 quốc gia trong giai đoạn 1964 – 2024 . Bộ dữ liệu được biên soạn và duy trì bởi dự án Our World in Data (OWID) , phát hành trên GitHub dưới giấy phép CC-BY . 2. Có gì trong bộ dữ liệu này? Năng lượng: Sản lượng/tiêu thụ Oil, Coal, Gas, Hydro, Wind, Solar (TWh). Phát thải: Tổng CO₂ và C
27 thg 102 phút đọc


Customer Support Dataset – Phân tích dữ liệu hỗ trợ khách hàng trong 12 tháng thực tế
Bạn đang muốn luyện phân tích dữ liệu thực tế về dịch vụ khách hàng?Bạn cần một bộ dữ liệu có đầy đủ yếu tố để thực hành từ làm sạch, trực quan hóa, đến storytelling theo chuẩn Business Intelligence? Customer Support Dataset sẽ giúp bạn làm được điều đó – với 12 tháng dữ liệu chăm sóc kỹ thuật từ một công ty SaaS, có phân loại ảnh hưởng (impact level), thời gian xử lý và trạng thái case. Về bộ dữ liệu Customer Support Dataset Bộ dữ liệu mô phỏng toàn bộ hệ thống hỗ trợ khách
27 thg 103 phút đọc


Nike Performances Dataset: Giải mã chiến lược vận hành và mở rộng toàn cầu qua dữ liệu
Làm thế nào để một thương hiệu thể thao như Nike xây dựng đế chế toàn cầu? Với bộ dữ liệu Nike đa chiều, bạn có thể khám phá hành trình này thông qua các chỉ số về sản phẩm, tài chính, sản xuất và cổ phiếu – được thu thập trong giai đoạn 2017–2022. 1. Tổng quan về bộ dữ liệu Nike Performances Bộ dataset bao gồm: Thông tin sản phẩm: loại sản phẩm, giá bán, rating khách hàng, tình trạng tồn kho… Dữ liệu tài chính: doanh thu theo khu vực, chi phí, lợi nhuận, biến động cổ phiếu…
27 thg 102 phút đọc


Dataset thực tế mô phỏng quy trình Supply Chain: Đặt hàng, Nhận hàng và Xuất bán
Bạn đang tìm kiếm một bộ dữ liệu thực tế để luyện phân tích chuỗi cung ứng bằng Power BI ? Hầu hết các file mẫu đều đơn giản, ít chiều dữ liệu và không phản ánh được dòng vận hành thực trong doanh nghiệp. Nhưng với bộ dataset “Purchase ➝ Inventory ➝ Sales” dưới đây, bạn sẽ có cơ hội thực hành như đang xử lý dự án BI nội bộ thực thụ – bao gồm cả phức tạp về thời gian, dữ liệu rời rạc, và không có khóa liên kết. Giới thiệu về bộ dataset File: Data Challenge 7.xlsx Định dạng: E
27 thg 103 phút đọc


Digital Ads Performance – Bộ dataset giải mã hiệu suất quảng cáo đa kênh!
Bạn đang tìm một bộ dữ liệu chất lượng cao để luyện kỹ năng phân tích marketing, tối ưu phễu chuyển đổi và chứng minh ROI? Digital Ads Performance Dataset là lựa chọn lý tưởng – giúp bạn mổ xẻ từng đồng chi phí quảng cáo, so sánh hiệu suất giữa các kênh như Google, Meta, YouTube, Naver… và trực quan hóa toàn bộ hành trình khách hàng từ Click đến Purchase. Về bộ dữ liệu Digital Ads Performance Dashboard được thiết kế để: So sánh hiệu quả của các kênh quảng cáo khác nhau Theo
27 thg 102 phút đọc


Phân tích mức lương ngành dữ liệu với Data Science Job Salaries
Bạn đang tìm một tập dữ liệu chất lượng để luyện phân tích?Bạn muốn trực tiếp bóc tách mức lương ngành dữ liệu theo từng vị trí, cấp bậc, quốc gia? Data Science Job Salaries là một tập dữ liệu công khai đã được xử lý và làm sạch, rất phù hợp để thực hành phân tích, thiết kế dashboard, và xây dựng portfolio cá nhân trong lĩnh vực dữ liệu. 1. Tổng quan về dataset Nguồn: Hugging Face Thời gian: Giai đoạn 2020–2022 Số dòng dữ liệu: 607 bản ghi đã được làm sạch Phạm vi phân tích:
27 thg 102 phút đọc


Retail Analytics Dataset – Khám phá chân dung khách hàng từ dữ liệu kinh doanh bán lẻ thực tế
Phân tích khách hàng luôn là bài toán hàng đầu để tối ưu hóa ngân sách và tăng lợi nhuận cho doanh nghiệp bán lẻ. Bạn có bao giờ tự hỏi liệu giảm giá 50% có thực sự thu hút khách hàng mua nhiều hơn, hay chỉ đơn giản là “đốt” tiền mà chẳng thay đổi hành vi của họ? Retail Analytics Dataset chính là giải pháp thực tế và hiệu quả, cung cấp cho bạn những con số chính xác thay vì những phỏng đoán cảm tính. Retail Analytics Dataset gồm những thông tin giá trị gì? 1. Phân khúc khách
27 thg 103 phút đọc


Supply Chain Dataset: Thực Hành Phân Tích Chuỗi Cung Ứng Từ Đầu Đến Cuối
Bạn đang học Power BI, muốn luyện tập phân tích dữ liệu thực tế nhưng lại chỉ tìm thấy các file bán hàng hoặc marketing đơn giản? Bộ dữ liệu Supply Chain dưới đây là một trong số hiếm những file có thể mô phỏng trọn vẹn hành trình của chuỗi cung ứng :Từ đặt hàng (Order) ➝ xử lý & giao hàng (Fulfillment) ➝ đến khách nhận hàng (Delivery) Tại sao file này đặc biệt? Không giống như các file Excel mẫu đơn giản, dataset này có cấu trúc đa chiều, giúp người học luyện tập toàn bộ
27 thg 103 phút đọc


Technical Support Dataset – Bộ dữ liệu đánh giá hiệu quả đội hỗ trợ kỹ thuật từ A đến Z
Bạn đang tìm một bộ dữ liệu giúp thực hành phân tích vận hành và đánh giá hiệu suất đội hỗ trợ kỹ thuật? Bộ Technical Support Dataset cung cấp hơn 2.300 yêu cầu hỗ trợ (ticket) , giúp bạn mô phỏng chính xác quy trình xử lý từ lúc tiếp nhận đến khi đóng ticket – với đầy đủ chỉ số về SLA, mức độ ưu tiên, mức độ hài lòng của khách hàng, và nhiều hơn thế. 1. Giới thiệu bộ dữ liệu Technical Support Dataset mô phỏng hoạt động của một trung tâm hỗ trợ kỹ thuật, với hơn 2.300 ticke
27 thg 102 phút đọc


Phân tích OEE – Dataset sản xuất thực tế cho người học BI
Nếu bạn đang học Power BI và muốn luyện phân tích trong ngành sản xuất, nhưng không biết bắt đầu từ đâu, thì file này chính là lựa chọn phù hợp để bắt đầu. Khác với các bài tập “kéo-thả cho đẹp”, file Power BI này mô phỏng một tình huống thật: cách nhà máy theo dõi hiệu suất máy móc thông qua chỉ số OEE (Overall Equipment Effectiveness). OEE là một chỉ số quan trọng trong ngành sản xuất, phản ánh hiệu suất tổng thể của thiết bị dựa trên 3 yếu tố: Availability – mức độ sẵn s
27 thg 102 phút đọc


Dataset Learning Portal: Thực hành Learning Analytics với Dashboard Power BI
Trong lĩnh vực Data Analytics và Business Intelligence , việc thực hành với dữ liệu thực tế là cách nhanh nhất để nâng cao kỹ năng. Một trong những dataset tiêu biểu chính là 365 Learning Portal Dataset , phản ánh hành vi học tập và kết quả của hàng chục ngàn học viên trên một nền tảng trực tuyến. Bộ dữ liệu này phù hợp cho những ai muốn luyện tập xây dựng dashboard phân tích học tập (Learning Analytics Dashboard) bằng Power BI hoặc Tableau. 1. Nội dung dataset Dataset bao g
27 thg 103 phút đọc
bottom of page












