Posted on Leave a comment

DYNAMIC MEASURE trong Power BI

Dynamic measure

Trong xây dựng báo cáo, từ dữ liệu có sẵn, chúng ta có thể tạo ra nhiều chỉ số có ý nghĩa để có những đánh giá toàn diện hơn. Các chiều dữ liệu đóng vai trò context. Chúng ta đưa chỉ số vào trong các context cụ thể để tạo nên những visual khác nhau. Giả sử có n chỉ số và m chiều phân tích, chúng ta có thể kết hợp để tạo ra tối thiểu n x m visual. Chúng ta muốn thể hiện trong cùng 1 page báo cáo, tuy nhiên báo cáo trở nên rối, chiếm nhiều không gian và cảm giác lặp lại. Dynamic Measure là 1 tip hay để xử lý tình huống này.

Trong bài này, Datapot giới thiệu đến người đọc cách sử dụng Dynamic measure trong Power BI.

Download file Power BI Tại đây

(Tham khảo Các thao tác đơn giản để tạo báo cáo trên Power BI cho người mới bắt đầu Tại đây)

(Tham khảo Cách xây dựng Cohort Analysis trên Power BI Tại đây)

Xây dựng Dynamic Measure trên Power BI.


Giả sử chúng ta có một bảng dữ liệu có tên là “SalesTable” bao gồm 2 cột:
Customerkey: Cột chứa key định danh cho mỗi khách hàng mua dịch vụ.
OrderDate: Ngày ngày hàng có đặt hàng dịch vụ
Mỗi dòng dữ liệu là 1 giao dịch bán hàng.
Ngoài ra ta cũng có 1 bảng “Date”, có relationship với bảng “SalesTable” thông qua cột DateOrderDate

2 bảng trong Dynamic measure
Mối quan hệ giữa bảng Date và bảng SalesTable

Chúng ta có 2 chỉ số được tính toán như sau:  

  • Số lượng khách hàng  

No.Customers = DISTINCTCOUNT(‘SalesTable'[Customerkey]) 

  • Số lượng giao dịch  

No.Orders = COUNTROWS(SalesTable) 

Thông thường, chúng ta tạo ra 2 biểu đồ để thể hiện được số lượng khách hàng theo từng tháng và số lượng order theo từng tháng:

2 biểu đồ theo tháng
Biểu đồ để thể hiện được số lượng khách hàng theo từng tháng và số lượng order theo từng tháng

Tuy nhiên, chúng ta có thể có thể sử dụng Dynamic measure để kết hợp chúng lại trong 1 visual duy nhất, và sử dụng Slicer để lựa chọn visual sẽ hiển thị theo chỉ số nào.

Để tạo dynamic measure, chúng ta sẽ làm lần lượt các bước sau:  

Bước 1: Tạo 1 bảng đặt tên là “Disconnected_table”, bảng này có 2 cột là “id” và cột “measure”.

Trong đó cột “measure” có giá trị là tên các measure mà chúng ta muốn thể hiện trong báo cáo. Cụ thể, ở đây là 2 measure No.CustomersNo.Orders. Cột “id” là thứ tự xuất hiện của từng measure.  

Sử dụng luôn tùy chọn Enter data trong Power BI. Lưu ý trong cột measure, chúng ta không nhất thiết phải đặt tên giống hệt tên measure, có thể đặt khác đi nhưng phải đảm bảo ý nghĩa để end user sử dụng sau này. Ví dụ thay vì “No.Customers” chúng ta gõ “Number of Customers”.

Bước 1 tạo Dynamic measure
Bảng Disconnected _table

Bảng “Disconnected_table” không cần tạo relationship với các bảng khác trong data model.

Bước 2: Sort cột measure theo cột id

Sort cột measure theo cột id
Sort cột measure theo cột id

Bước 3: Tạo 1 measure điều khiển chỉ số xuất hiện trong visual.

Dynamic_measure =
IF(HASONEVALUE(Disconnected_table[measure]),
SWITCH(TRUE(),
VALUES(Disconnected_table[measure]) = “No.Customers”, [No.Customers],
VALUES(Disconnected_table[measure]) = “No.Orders”, [No.Orders]
))

Bước 4: Tạo Slicer sử dụng để lựa chọn chỉ số xuất hiện trong visual thông qua cột measure trong bảng.

Slicer
Lựa chọn chỉ số xuất hiện trong visual

Bước 5: Tạo visual, ví dụ thể hiện chỉ số theo tháng. Trong tùy chọn Values, ta kéo “Dynamic measure” vào.

Kéo Dynamic measure  vào Values
Kéo Dynamic measure vào tùy chọn Values

Như vậy ta đã hoàn thành xong Dynamic measure.

Tuy nhiên có 1 vấn đề là title của chart chưa được dynamic. Để xử lý, ta có 1 số bước sau:

⦁ Bước 1: Trong bảng “Disconected_table”, ta tạo thêm 1 cột mới là “title”.

Cột này sẽ sử dụng để điều khiển title của visual.
title = SWITCH(Disconnected_table[measure], “No.Customers”, “Number of Customers by Month”, “Number of Orders by Month”)
Chúng ta có thể tạo ra cột title ngay từ đầu khi tạo bảng “Disconnected_table

⦁ Bước 2: Trong tùy chọn Title ở phần Format. Ta chọn biểu tượng fx

Tùy chọn Title
Tùy chon Title ở Format

Tại hộp thoại Title text, tại Based on filed, chọn cột “title” trong bảng “Disconnected_table

Chọn cột Title
Chọn cột “title” trong bảng “Disconnected_table

Kết quả ta được

Tham khảo kết quả tại: Dynamic measure report


Ví dụ trên chúng ta chỉ có 2 measure, trong bài toán thực tế, các bạn có thể tạo ra dynamic measure gồm nhiều loại measure khác nhau.

Nội dung sắp tới, chúng ta sẽ cùng nghĩ cách để có thể thực hiện conditional formating với những visual đang sử dụng dynamic measure.

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn
Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos
Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher
Posted on 1 Comment

KINH NGHIỆM THI DA-100: CÁC TOPICS TRONG BÀI THI DA-100

DAA

Bạn đang làm Data Analyst và muốn nâng cao chuyên môn? Bạn muốn chuyển ngành và muốn bước chân và ngành Khoa học Dữ liệu? Chứng chỉ DAA (microsoft data analytics certification) sẽ là tấm vé cho bạn. Bài thi DA-100 là một data analysis test/ Power BI exam đến từ Microsoft. Nếu bạn muốn thi DA-100 nhưng không biết bắt đầu từ đâu, hãy theo dõi bài viết của Datapot để có cái nhìn chuẩn xác và hướng đi nhanh nhất chinh phục kỳ thi này nhé.

Tham khảo Hướng dẫn đăng ký thi DA-100 tại: HƯỚNG DẪN ĐĂNG KÝ THI CHỨNG CHỈ DA-100 – Datapot.vn

data analyst certification microsoft

Cấu trúc bài thi DA-100

Đề thi DA-100 của Microsoft bao gồm 5 chủ đề chính với tỉ trọng điểm số như sau: 

  • Prepare the data (20-25%) 
  • Model the data (25-30%) 
  • Visualize the data (20-25%) 
  • Analyze the data (10-15%) 
  • Deploy and maintain deliverables (10-15%) 

Các bạn có thể download đề cương kỹ năng tại đây: https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu 

Sau đây, chúng ta sẽ đi sâu hơn về ý nghĩa và các nội dung cần học trong từng Topic cụ thể  

Topic 1: Prepare the data – Chuẩn bị dữ liệu

Prepare the data là topic chiếm từ 20 – 25% tổng điểm của bài thi. Đây là phần việc cơ bản nhưng không kém quan trọng khi data analyst làm việc với dữ liệu, không chỉ trên Power BI mà còn với các công cụ, ngôn ngữ khác. Prepare the data trong Power BI là quá trình bao gồm các phần việc chính sau: Get data from different data sources — > Profile the data — > Clean, transform, and load the data

Ôn thi DA-100
3 nhiệm vụ của Prepare the data trong Power BI

  • Get data from different data sources 

Có rất nhiều loại dữ liệu khác nhau trong một tổ chức, doanh nghiệp và nó cũng được lưu trữ ở nhiều nguồn khác nhau. Đơn giản có thể là Excel, CSV, tổ chức hơn thì là trong các hệ cơ sở quản trị dữ liệu như MS SQL, MySQL…, hay trên các cloud như Google bigquery, Microsoft Azure. Với phần này, chúng ta cần nắm được cách xác định và kết nối đến nguồn dữ liệu, ngoài ra làm sao để thay đổi setting đối với nguồn dữ liệu.  

Ví dụ: Các bảng có cùng định dạng excel đang lưu trong 1 folder chung. Làm sao để import tất cả đồng thời và nối chúng lại thành 1 bảng duy nhất?  

  • Profile the data 

Dữ liệu luôn có thể tồn tại những vấn đề của chính nó, có thể là thiếu dữ liệu ở 1 số cột dữ liệu nào đó, hoặc liệu có thể tồn tại outlier. Bước Profile the data là bước cần thiết để chúng ta nhìn nhận dữ liệu một cách tổng quan và tìm ra những vấn đề của dữ liệu nếu có, từ đó có hướng xử lý tiếp theo. Ở phần này, chúng ta cần biết được khi nào thì sử dụng.  

Ví dụ: Để xác định được tỉ lệ missing thì cần dùng tùy chọn nào trong Power Query Editor? (Data Quality) Hay để xác định được phân bố dữ liệu thì dùng tùy chọn nào? (Column Distribution)

  • Clean, transform, and load the data 

Dữ liệu sau khi được import vào có thể chưa được sạch, tinh gọn và có thể chưa đáp ứng nhu cầu phân tích, báo cáo về sau. Clean và transform gần như là bước không thể thiếu khi làm việc với dữ liệu trên Power BI. Sau khi thao tác làm sạch, biến đổi theo mong muốn, chúng ta cần load dữ liệu vào data model để phục vụ tiếp các phần sau.

Tại phần việc này, chúng ta cần nắm được các thao tác định dạng dữ liệu, fill dữ liệu, đặt header, xóa dòng xóa cột, split, transpose, merge, append data, các phép join … Bên cạnh đó, một chút kiến thức cơ bản về Power Query M code là cần thiết.  

Ví dụ: Bảng dữ liệu về doanh số bán hàng có tên là “Sales.xlsx” sau khi import, tên cột của bảng đang trở thành dòng thứ nhất của bảng dữ liệu. Bên cạnh đó có cột price đang có định dạng text, với giá trị bên trong có format “$ 100”. Dùng những lệnh nào để có thể đặt lại header cho bảng và tách cột giá thành 2 cột là currency có dạng “$”. Cột còn lại tên là price_1 chính là giá trị số (ví dụ số 100) trong chính cột price ban đầu. (User first row as header, Split) 

Topic 2: Model the data – Lập mô hình dữ liệu 

Kiến thức và kĩ năng về Model the data là quan trọng bậc nhất và tất nhiên cũng là khó nhằn nhất trong Power BI exam. Trọng số cho phần này là 25 – 30% tổng điểm của bài thi DA-100. Model the data được chia thành 4 nhóm nội dung chính.  

Bài thi DA-100
4 nhóm nội dung chính của Model the data

  • Design a data model 

Việc đầu tiên sau khi load dữ liệu chính là thiết kế data model. Data model nói một cách đơn giản, chúng ta xây dựng mối quan hệ giữa các bảng dữ liệu. Với phần này, data analyst cần nắm được 1 số kiến thức về các tính chất của bảng, cột, quick measures, hierarchy, role-playing dimensions, cardinality and cross-filter direction trong 1 relationship.

  • Develop a data model 

Sau khi design một data model cơ bản dựa trên những gì chúng ta có sau khi load dữ liệu. Chúng ta có thể phát triển, mở rộng data model thông qua việc tạo thêm các calculated column, calculated table, hierarchies… Phần việc này thường cần thiết, khi data model sẵn có có thể không đáp ứng được nhu cầu báo cáo. Với phần này, chúng ta cần nắm được kiến thức, kĩ năng tạo hierarchy, calculated column, calculated table. Bên cạnh đó 1 số kiến thức về cross-filter direction and security filtering, row-level security roles, object-level security. 

  • Create measures by using DAX 

Power BI cung cấp cho chúng ta các Implicit Measure thông qua kéo thả cột khi visualization. Tuy nhiên nhu cầu tạo ra những chỉ số phức tạp hơn, giúp báo cáo có thêm các góc nhìn mới mẻ hơn, khi đó chúng ta cần sử dụng DAX để tạo ra measures. Cần ôn tập một số nhóm DAX function thường gặp khi xử lý với dữ liệu text, string, aggregate. Bên cạnh đó là nhóm hàm liên quan đến Calculate để thể hiện filter context trong DAX. Nhóm hàm Time Intelligence cũng đáng chú ý.   

  • Optimize model performance 

Khi data model nhẹ, Optimize model performance có thể chưa phải là vấn đề đối với bạn. Tuy nhiên, khi chúng ta có những bảng dữ liệu rất lớn, data model phức tạp, sử dụng nhiều measure phức tạp khiến việc tính toán, xử lý bị chậm, đấy là lúc chúng ta cần nghĩ đến tối ưu model performance. Đơn giản, chúng ta loại đi những cột không cần thiết, filter những dòng dữ liệu không sử dụng cho báo cáo, ví dụ như data quá khứ từ rất xa chẳng hạn. Tốn nhiều công sức hơn 1 chút, chúng ta review lại code DAX xem đã tối ưu chưa. 

Topic 3: Visualize the Data – Trực quan hóa dữ liệu

Sau khi đã có được data model tạm thời như ý (thực tế phải update rất nhiều) thì chúng ta bắt tay làm một số việc mà nhiều người học Power BI sẽ hào hứng nhất, đó chính là visualize. Nói đơn giản, chúng ta tạo các bảng, biểu đồ để trả lời cho những câu hỏi mà chúng ta, hoặc sếp của chúng ta đặt ra. Phần này chiếm đến 20 – 25% tổng điểm của bài thi DA-100. Rất quan trọng. Các nội dung bao gồm: Create Reports, Create Dashboards, Enrich reports for usability.

Kinh nghiêm thi DA-100
3 nội dung chính của Visualize the data

  • Create Reports 

Chúng ta sẽ tạo ra những bảng, biểu đồ phù hợp để trả lời các câu hỏi. Ví dụ: Muốn biết xu thế tăng hay giảm doanh thu qua các tháng, hay sự tăng trưởng doanh thu so với cùng kì năm trước… Với phần này, chúng ta cần nắm được các loại bảng, biểu, cách dùng của nó phù hợp với những tình huống, trả lời cho những câu hỏi nào. Với mỗi loại visual cụ thể, chúng ta cần biết đưa cột (field) nào vào. Một số kiến thức về format, apply filter…  

  • Create Dashboards 

Dashboard là tập hợp của nhiều report. Một số kiến thức cần ôn tập như là set mobile view, manage tiles on a dashboard, configure data alerts, use the Q&A feature, add a dashboard theme, pin a live report page to a dashboard. 

  • Enrich reports for usability 

Chúng ta có thể tạo 1 số thiết lập để giúp báo cáo dễ xem hơn, dễ dàng trình diễn dữ liệu hơn đối với người xem (end user). Một số kiến thức cần ôn tập như bookmark, tooltip, Interaction giữa các visual trong cùng 1 page, sorting, drillthrough and cross filter, export data…

Topic 4: Analyze the Data – Phân tích dữ liệu

Các câu hỏi về Analyze Data chiếm 10 – 15% tổng điểm của bài thi Chứng chỉ DA-100. Analyze the data giúp chúng ta tìm kiếm được những insight, điểm nhấn từ dữ liệu, từ rất nhiều bảng biểu đã tạo trước đó. Đây cũng là phần tạo ra sự khác biệt giữa chúng ta so với những người dùng Power BI khác. Có 2 nội dung chính: Enhance reports to expose insights và Perform advanced analysis.

Chứng chỉ DA-100
2 nội dung chính trong Analyze the data

  • Enhance reports to expose insights 

Các câu hỏi có thể liên quan đến conditional formatting, áp dụng slicer, filters, Top N, Q&A visual, … 

  • Perform advanced analysis 

Các câu hỏi có thể liên quan đến cách xác định outliers, time series analysis, sử dụng groupings và binnings, Key Influencers to explore dimensional variances, decomposition tree visual, Al insights.  

Topic 5: Deploy and Maintain Deliverables – Triển khai và duy trì các sản phẩm đã giao

Các câu hỏi liên quan đến giai đoạn sau khi hoàn thiện dashboard chiếm khoảng 10 – 15% tổng điểm của bài thi. Có thể chia topic này thành 2 phần nội dung chính: Manage datasets và Create and manage workspaces

DA-100 Microsoft
2 nội dung chính của Deploy and Maintain Deliverables

  • Manage datasets 

Chúng ta ôn tập các kiến thức liên quan đến quản lý dataset. Một số kiến thức chính như: Cách thiết lập lịch trình resfresh cho dashboard trên service. Cách cấu hình row-level security trong trường hợp chúng ta muốn phân quyền dữ liệu/báo cáo hiển thị cho từng nhóm user khác nhau. Các thiết lập tùy chọn incremental refresh giúp quá trình refresh nhanh hơn…

  • Create and manage workspaces 

Một số kiến thức cần ôn tập liên quan đến phần tạo và quản lý workspaces trên Power BI service như: cách tạo và cấu hình một workspace, assign workspace roles, cách cấu hình và cập nhật một workspace app, … 

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn
Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos
Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/
Chi tiết tham khảo: https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu
https://ravikirans.com/da-100-power-platform-exam-study-guide/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher