![2910164_452-[Converted].jpg](https://static.wixstatic.com/media/eef8ce_2e83df6e30ad4155aab60ee096ddff38~mv2.jpg/v1/crop/x_61,y_38,w_620,h_361/fill/w_406,h_237,al_c,q_80,usm_0.66_1.00_0.01,enc_avif,quality_auto/2910164_452-%5BConverted%5D.jpg)
DATABASE MÔ PHỎNG DATA WAREHOUSE THỰC TẾ
Tài liệu bao gồm 8 database mô phỏng cấu trúc thực tế Data Warehouse và đủ phức tạp để làm Business Intelligence Project chuyên nghiệp nhất.
Mỗi Database đều sẽ có Diagram thể hiện các bảng và trường trong bảng giúp bạn hình dung cụ thể hơn về database đó bao gồm những gì và các bảng được liên kết với nhau như thế nào.
Bộ database cung cấp 2 định dạng Raw Data: 1 file CSV hoặc Excel đẩy trực tiếp vào tool và và 1 file bak để đảm bảo tính toàn vẹn của dữ liệu và cho phép khôi phục trong trường hợp cần thiết.
Anh/chị quan tâm vui lòng đăng ký để nhận tài liệu miễn phí!
Database mô phỏng Datawarehouse thực tế để làm Business Intelligence Project chuyên nghiệp nhất
Tài liệu bao gồm 8 database mô phỏng cấu trúc thực tế Data Warehouse và đủ phức tạp để làm Business Intelligence Project chuyên nghiệp nhất. Các nguồn lấy dataset như Kaggle, Dataset Research,… không có cấu trúc đầy đủ và phức tạp để làm dự án phân tích dữ liệu kinh doanh thông minh chuyên nghiệp. Mỗi database đều sẽ có diagram thể hiện các bảng và trường trong bảng giúp bạn hình dung cụ thể hơn về database đó bao gồm những gì và các bảng được liên kết với nhau như thế nào. MDA sẽ mô tả tổng quát về mỗi database bên dưới nhé!
1. Database Contoso
Database Contoso là một cơ sở dữ liệu ví dụ được Microsoft tạo ra để giúp học và phát triển các ứng dụng trong môi trường Microsoft SQL Server. Nó được sử dụng như một bộ dữ liệu mẫu để giới thiệu các sản phẩm Microsoft Business Intelligence và các chức năng DW/BI trong toàn bộ dòng sản phẩm Microsoft Office. Bộ dữ liệu bao gồm thông tin về các bộ phận của công ty như C-levels, Sales/Marketing, IT, Finance và hỗ trợ tích hợp bản đồ, cung cấp cả dữ liệu OLTP (Online Transaction Processing) và OLAP (Online Analytical Processing), cùng với dữ liệu tham chiếu và thứ nguyên. Cơ sở dữ liệu Contoso bao gồm các bảng như Customer, Order, OrderDetail và Product, mỗi bảng chứa thông tin khác nhau về các khách hàng, đơn hàng, chi tiết đơn hàng và sản phẩm của công ty. Các bảng này có các quan hệ với nhau, cho phép các truy vấn dữ liệu phức tạp và hiệu quả. Ví dụ, một khách hàng có thể có nhiều đơn hàng khác nhau và mỗi đơn hàng có thể có nhiều chi tiết đơn hàng khác nhau. Những dữ liệu này có thể được sử dụng để phân tích dữ liệu, trực quan hóa và huấn luyện các mô hình dự đoán và phân loại. Trong giáo dục, Contoso thường được sử dụng như một ví dụ để giảng dạy về các khái niệm trong nhiều lĩnh vực chẳng hạn như cơ sở dữ liệu, phát triển ứng dụng và quản lý hệ thống.
2. Database AdventureWorks
Cơ sở dữ liệu AdventureWorks là một cơ sở dữ liệu mẫu được Microsoft phát triển với mục đích giúp người dùng hiểu rõ hơn về các công nghệ của Microsoft và học cách sử dụng chúng để phát triển các ứng dụng. Cơ sở dữ liệu này được thiết kế cho SQL Server, nhưng cũng có thể được sử dụng với các hệ thống quản lý cơ sở dữ liệu khác như Oracle, MySQL, PostgreSQL. AdventureWorks được lấy bối cảnh trên một công ty hư cấu có tên AdventureWorks Cycles, một công ty sản xuất và kinh doanh xe đạp với quy mô lớn. Cơ sở dữ liệu này chứa các bảng, chế độ xem và thủ tục liên quan đến các hoạt động quản lý khách hàng, sản phẩm, đặt hàng và các giao dịch khác, được sử dụng để minh họa cho các đối tượng trong xử lý tác vụ (OLTP). Cơ sở dữ liệu AdventureWorks cung cấp các chức năng phức tạp như xử lý dữ liệu với giao dịch và kết hợp dữ liệu từ nhiều bảng khác nhau trong cơ sở dữ liệu. Ngoài ra, AdventureWorks còn có các tính năng đáng chú ý như sử dụng các ràng buộc dữ liệu để bảo vệ tính toàn vẹn của dữ liệu, sử dụng các chỉ mục để tối ưu hóa hiệu suất truy cập dữ liệu và sử dụng các trigger để tự động thực hiện các hành động khi dữ liệu được thêm, sửa hoặc xóa. Các tính năng này giúp AdventureWorks trở thành một cơ sở dữ liệu mẫu rất hữu ích cho các nhà phát triển và quản trị cơ sở dữ liệu. Các tập dữ liệu trong AdventureWorks có thể được sử dụng để phân tích dữ liệu, trực quan hóa và huấn luyện các mô hình dự đoán và phân loại. AdventureWorks cũng được sử dụng trong nhiều khóa học, chứng chỉ và đào tạo về quản trị cơ sở dữ liệu, thiết kế cơ sở dữ liệu và phát triển ứng dụng.
3. Database WideWorldImposter
Cơ sở dữ liệu WideWorldImporters là một nguồn tài nguyên quan trọng cho các nhà phát triển và quản trị cơ sở dữ liệu để tìm hiểu và thực hành các tính năng mới của SQL Server và Cơ sở dữ liệu Azure SQL. Nó cũng là một cơ sở dữ liệu bán buôn chứa nhiều thông tin về hoạt động nhập khẩu và xuất khẩu hàng hóa. Với các tính năng và công nghệ mới của SQL Server, cơ sở dữ liệu này cho phép thực hiện đa kết nối, xử lý dữ liệu trực tiếp trong bộ nhớ và tìm kiếm văn bản đầy đủ. Các bảng dữ liệu trong cơ sở dữ liệu WideWorldImporters cung cấp thông tin chi tiết về các khía cạnh khác nhau của hoạt động kinh doanh của công ty bán buôn. Các đối tượng chính bao gồm khách hàng, đơn hàng, sản phẩm, kho hàng, nhà cung cấp và nhân viên. Ngoài ra, cơ sở dữ liệu này còn chứa các đối tượng quan trọng khác như tài khoản, địa chỉ, hóa đơn và phí vận chuyển. Phân tích dữ liệu trong cơ sở dữ liệu WideWorldImporters có thể giúp cho các nhà phát triển và quản trị cơ sở dữ liệu hiểu rõ hơn về hoạt động kinh doanh của công ty bán buôn và tìm kiếm các cơ hội để tối ưu hóa hiệu suất và tăng trưởng kinh doanh. Cơ sở dữ liệu WideWorldImporters được phát triển bằng ngôn ngữ T-SQL và có thể sử dụng trên nhiều nền tảng hệ điều hành khác nhau, bao gồm Windows và Linux. Điều này cho phép các nhà phát triển và quản trị cơ sở dữ liệu có thể sử dụng cơ sở dữ liệu này trên nhiều hệ thống khác nhau để phát triển và triển khai ứng dụng. Ngoài ra, cơ sở dữ liệu này cũng có thể sử dụng trên đám mây thông qua Azure SQL Database và Azure SQL Managed Instance để cung cấp khả năng mở rộng và quản lý dữ liệu dễ dàng hơn.
4. Database Chinook
Cơ sở dữ liệu Chinook được phát triển để giúp người học và giảng viên trong việc tìm hiểu và thực hành các kỹ năng quản lý cơ sở dữ liệu. Với các bảng như artists, albums, media tracks, invoices và customers, Chinook cung cấp một cách tiếp cận thực tế và dễ hiểu cho quản lý cơ sở dữ liệu trong lĩnh vực bán lẻ đĩa nhạc. Cơ sở dữ liệu Chinook được tạo ra bởi Jeff Richter và phát hành dưới giấy phép MIT, cho phép người dùng tự do sử dụng và sửa đổi cơ sở dữ liệu theo nhu cầu của mình. Cơ sở dữ liệu Chinook có sẵn cho nhiều hệ quản trị cơ sở dữ liệu khác nhau, bao gồm SQL Server, Oracle, MySQL và nhiều hơn nữa. Cơ sở dữ liệu Chinook cũng được coi là một giải pháp thay thế cho cơ sở dữ liệu Northwind, cũng là một cơ sở dữ liệu mẫu phổ biến được sử dụng để học tập và đào tạo quản lý cơ sở dữ liệu. Tuy nhiên, Chinook cung cấp nhiều thông tin hơn về lĩnh vực bán lẻ đĩa nhạc và có thể được sử dụng để phát triển các ứng dụng thực tế trong ngành.
5. Sakila
Sakila là một cơ sở dữ liệu được sử dụng rộng rãi trong giáo dục và đào tạo về quản trị cơ sở dữ liệu. Cơ sở dữ liệu này được phát triển bởi MySQL và bao gồm các bảng để quản lý danh sách phim, nhân viên, khách hàng và các bản sao DVD của phim. Sakila có nhiều bảng như actor, film, category, customer và rental. Nó được thiết kế để giúp người học và nhà phát triển thực hành các kỹ năng quản lý cơ sở dữ liệu, từ thiết kế cơ sở dữ liệu, tạo truy vấn đến tối ưu hóa hiệu suất. Sakila cũng cung cấp một số hệ thống báo cáo và tập tin kịch bản để giúp người dùng thực hành và hiểu rõ hơn về cơ sở dữ liệu này. Vì Sakila là một cơ sở dữ liệu mẫu miễn phí, nó có sẵn cho nhiều hệ quản trị cơ sở dữ liệu khác nhau, bao gồm MySQL, SQL Server và PostgreSQL. Điều này giúp cho người học và nhà phát triển có thể truy cập dễ dàng và nhanh chóng vào cơ sở dữ liệu để thực hành và phát triển các kỹ năng của mình trong lĩnh vực quản trị cơ sở dữ liệu.
6. Database Northwind
Northwind Database là một cơ sở dữ liệu nổi tiếng của Microsoft, chứa dữ liệu về hoạt động thương mại của một công ty ảo tên là Northwind chuyên nhập và xuất hàng thực phẩm. Các bảng trong Database này sẽ là một ví dụ kinh điển cho bài toán bán hàng và được sử dụng rộng rãi trong việc học tập và đào tạo quản trị cơ sở dữ liệu. Cơ sở dữ liệu Northwind cung cấp các bảng để quản lý các danh sách sản phẩm, đặt hàng, nhà cung cấp, khách hàng và nhân viên. Nó được thiết kế để giúp người học thực hành các kỹ năng quản lý cơ sở dữ liệu, như thiết kế cơ sở dữ liệu, tạo truy vấn và tối ưu hóa hiệu suất. Cơ sở dữ liệu Northwind bao gồm các bảng như Products, Orders, Suppliers, Customers và Employees. Nó có thể được sử dụng để thực hành các kỹ năng như lập trình SQL, xử lý dữ liệu và thiết kế cơ sở dữ liệu. Ngoài ra, Northwind cũng cung cấp một số hệ thống báo cáo để giúp người dùng hiểu rõ hơn về cơ sở dữ liệu và thực hành các kỹ năng phân tích dữ liệu. Cơ sở dữ liệu Northwind đã được Microsoft sử dụng trong nhiều năm để giới thiệu các tính năng mới của SQL Server và các công nghệ cơ sở dữ liệu khác. Hiện tại, Northwind không được hỗ trợ chính thức bởi Microsoft, nhưng nó vẫn được sử dụng rộng rãi trong giáo dục và đào tạo.
7. World Database
World Database MySQL là một cơ sở dữ liệu mẫu đi kèm với hệ thống quản lý cơ sở dữ liệu quan hệ MySQL. Nó được thiết kế để là một cơ sở dữ liệu ví dụ thực tế để học và thực hành các truy vấn SQL (Structured Query Language). Cơ sở dữ liệu World Database MySQL bao gồm 3 bảng city, country, countrylanguage chứa thông tin về các quốc gia, thành phố của chúng và các thông tin liên quan khác như dân số, vùng miền, châu lục, v.v. Các bảng này có thể được sử dụng để thực hành các truy vấn SQL, ví dụ như tìm kiếm các quốc gia có dân số trên một ngưỡng nhất định, hay tìm kiếm các thành phố trong một quốc gia nào đó. Ngoài ra, World Database MySQL cũng được sử dụng rộng rãi trong các khóa học và các tài liệu về MySQL để giúp người học nắm vững các kỹ năng thao tác với cơ sở dữ liệu quan hệ.
8. Qlikview
QlikView là tập dữ liệu được sử dụng trong ứng dụng QlikView, một phần mềm dùng để trực quan hóa và phân tích dữ liệu. Tập dữ liệu này được tổ chức dưới dạng các bảng và liên kết với nhau thông qua các trường chung (key field) để tạo thành một cấu trúc dữ liệu quan hệ. QlikView dataset bao gồm các tập dữ liệu mẫu như Sales, Inventory, Human Resources, được cung cấp sẵn trong phần mềm để người dùng có thể dễ dàng thực hành và học tập. Ngoài ra, người dùng cũng có thể tạo và sử dụng các tập dữ liệu riêng của mình trong QlikView để trực quan hóa và phân tích dữ liệu. Tất cả các tập dữ liệu trong QlikView đều được thiết kế để cho phép người dùng thực hiện các truy vấn dữ liệu phức tạp, tạo báo cáo, biểu đồ và các mô hình dữ liệu trực quan để giúp người dùng hiểu rõ hơn về dữ liệu và đưa ra các quyết định kinh doanh chính xác hơn.
Tại sao nên học Phân tích Dữ liệu Kinh doanh tại MDA?
Cảm nhận học viên & doanh nghiệp
Hiển thị
80
kết quả
Trước đây mình từng tham gia 01 khóa học về DA nhưng khá đuối vì nhiều kiến thức IT. Còn với khóa BI của MDA, mình được học được rất nhiều kiến thức hữu ích, không chỉ gói gọn ở tool mà còn về mindset, tư duy đa chiều, xây dựng logic tree, tìm insight/aha moment và viết data storytelling

Lại Ngọc Anh
Nhân viên phân tích dữ liệu tại Công ty CP Xi măng Vicem Hà Tiên
Mình đã sử dụng kiến thức từ khoá học để áp dụng vào công việc và phát triển tư duy cho bản thân. Đặc biệt, những kiến thức này có thể áp dụng ngay cả khi không làm trong ngành phân tích dữ liệu. Giảng viên dạy rất kỹ và nhiệt tình, tâm huyết với khoá học.

Vũ Trần Ngọc Lê
Làm việc tại Reckitt Benckiser
Mình học được cách xử lý, làm sạch dữ liệu chuyên nghiệp. Đặc biệt là hiểu rõ mô hình, cấu trúc dữ liệu từ đó nắm bắt được mấu chốt vấn đề và biểu diễn chart, tìm ra insight. Giảng viên rất nhiệt tình, dù sau cả ngày làm việc nhưng vào học không buồn ngủ, rất hấp dẫn

Nguyễn Thị Phương Yến
Sales Performance tại Tân Hiệp Phát
Khóa học đem lại kiến thức về tư duy phân tích dữ liệu, cách xử lý dữ liệu một cách bài bản, chuyên nghiệp – rất hữu ích cho công việc hiện tại của mình. Bên cạnh đó, tài liệu và giáo trình đầy đủ chi tiết, cung cấp nhiều kiến thức hữu ích. Lộ trình rõ ràng học gì trước, sau.

Nguyễn Hoài Thắng
Nhân viên @Yokogawa Votiva Solutions
Khóa học 10 điểm không có nhưng. Đối với một người không có chút khái niệm gì về BI lúc mới bắt đầu học như mình thì cảm giác không còn sợ Power BI như trước nữa. Các thầy cô đều siêu dễ thương, nhiệt tình, luôn kiên nhẫn với học viên học chậm như mình.

Trần Lê Tố Nguyên
Operations Services Specialist tại Starbucks Việt Nam
Không giống với các khóa học khác, khóa học tại MDA đi sâu cả Power BI lẫn tư duy phân tích kinh doanh, phân bố tỷ trọng phù hợp. Mình nghĩ kỹ năng phân tích và kể chuyện với dữ liệu sẽ bổ trợ công việc quản trị Bệnh viện của mình rất nhiều

Kiều Quốc Chánh
Giám đốc Vận hành tại Bệnh viện Đa khoa Sài Gòn Tam Kỳ
Em rất hài lòng về khóa học, đặc biệt là cách giảng viên truyền đạt kiến thức một cách rõ ràng và dễ hiểu. Khóa học có cấu trúc hợp lý, giúp em nắm bắt kiến thức từ cơ bản đến nâng cao. Các bài tập thực hành cũng rất sát với thực tế, giúp em ứng dụng được ngay kiến thức vào công việc.

Lê Huỳnh Anh Tiến
FP&A @DRIPCARE GLOBAL
Đào Tạo & Dịch Vụ
Mastering Data Analytics là đơn vị hàng đầu cung cấp những khóa đào tạo public, đào tạo doanh nghiệp về Phân tích Dữ liệu và các dịch vụ tư vấn cho Doanh nghiệp
































![44534182_1115_BigData_MESH_13-31-(1)-[Converted].png](https://static.wixstatic.com/media/eef8ce_a7766c9763484a85ac402ad9f8e9730e~mv2.png/v1/fill/w_537,h_351,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/44534182_1115_BigData_MESH_13-31-(1)-%5BConverted%5D.png)

