Posted on Leave a comment

DYNAMIC MEASURE trong Power BI

Dynamic measure

Trong xây dựng báo cáo, từ dữ liệu có sẵn, chúng ta có thể tạo ra nhiều chỉ số có ý nghĩa để có những đánh giá toàn diện hơn. Các chiều dữ liệu đóng vai trò context. Chúng ta đưa chỉ số vào trong các context cụ thể để tạo nên những visual khác nhau. Giả sử có n chỉ số và m chiều phân tích, chúng ta có thể kết hợp để tạo ra tối thiểu n x m visual. Chúng ta muốn thể hiện trong cùng 1 page báo cáo, tuy nhiên báo cáo trở nên rối, chiếm nhiều không gian và cảm giác lặp lại. Dynamic Measure là 1 tip hay để xử lý tình huống này.

Trong bài này, Datapot giới thiệu đến người đọc cách sử dụng Dynamic measure trong Power BI.

Download file Power BI Tại đây

(Tham khảo Các thao tác đơn giản để tạo báo cáo trên Power BI cho người mới bắt đầu Tại đây)

(Tham khảo Cách xây dựng Cohort Analysis trên Power BI Tại đây)

Xây dựng Dynamic Measure trên Power BI.


Giả sử chúng ta có một bảng dữ liệu có tên là “SalesTable” bao gồm 2 cột:
Customerkey: Cột chứa key định danh cho mỗi khách hàng mua dịch vụ.
OrderDate: Ngày ngày hàng có đặt hàng dịch vụ
Mỗi dòng dữ liệu là 1 giao dịch bán hàng.
Ngoài ra ta cũng có 1 bảng “Date”, có relationship với bảng “SalesTable” thông qua cột DateOrderDate

2 bảng trong Dynamic measure
Mối quan hệ giữa bảng Date và bảng SalesTable

Chúng ta có 2 chỉ số được tính toán như sau:  

  • Số lượng khách hàng  

No.Customers = DISTINCTCOUNT(‘SalesTable'[Customerkey]) 

  • Số lượng giao dịch  

No.Orders = COUNTROWS(SalesTable) 

Thông thường, chúng ta tạo ra 2 biểu đồ để thể hiện được số lượng khách hàng theo từng tháng và số lượng order theo từng tháng:

2 biểu đồ theo tháng
Biểu đồ để thể hiện được số lượng khách hàng theo từng tháng và số lượng order theo từng tháng

Tuy nhiên, chúng ta có thể có thể sử dụng Dynamic measure để kết hợp chúng lại trong 1 visual duy nhất, và sử dụng Slicer để lựa chọn visual sẽ hiển thị theo chỉ số nào.

Để tạo dynamic measure, chúng ta sẽ làm lần lượt các bước sau:  

Bước 1: Tạo 1 bảng đặt tên là “Disconnected_table”, bảng này có 2 cột là “id” và cột “measure”.

Trong đó cột “measure” có giá trị là tên các measure mà chúng ta muốn thể hiện trong báo cáo. Cụ thể, ở đây là 2 measure No.CustomersNo.Orders. Cột “id” là thứ tự xuất hiện của từng measure.  

Sử dụng luôn tùy chọn Enter data trong Power BI. Lưu ý trong cột measure, chúng ta không nhất thiết phải đặt tên giống hệt tên measure, có thể đặt khác đi nhưng phải đảm bảo ý nghĩa để end user sử dụng sau này. Ví dụ thay vì “No.Customers” chúng ta gõ “Number of Customers”.

Bước 1 tạo Dynamic measure
Bảng Disconnected _table

Bảng “Disconnected_table” không cần tạo relationship với các bảng khác trong data model.

Bước 2: Sort cột measure theo cột id

Sort cột measure theo cột id
Sort cột measure theo cột id

Bước 3: Tạo 1 measure điều khiển chỉ số xuất hiện trong visual.

Dynamic_measure =
IF(HASONEVALUE(Disconnected_table[measure]),
SWITCH(TRUE(),
VALUES(Disconnected_table[measure]) = “No.Customers”, [No.Customers],
VALUES(Disconnected_table[measure]) = “No.Orders”, [No.Orders]
))

Bước 4: Tạo Slicer sử dụng để lựa chọn chỉ số xuất hiện trong visual thông qua cột measure trong bảng.

Slicer
Lựa chọn chỉ số xuất hiện trong visual

Bước 5: Tạo visual, ví dụ thể hiện chỉ số theo tháng. Trong tùy chọn Values, ta kéo “Dynamic measure” vào.

Kéo Dynamic measure  vào Values
Kéo Dynamic measure vào tùy chọn Values

Như vậy ta đã hoàn thành xong Dynamic measure.

Tuy nhiên có 1 vấn đề là title của chart chưa được dynamic. Để xử lý, ta có 1 số bước sau:

⦁ Bước 1: Trong bảng “Disconected_table”, ta tạo thêm 1 cột mới là “title”.

Cột này sẽ sử dụng để điều khiển title của visual.
title = SWITCH(Disconnected_table[measure], “No.Customers”, “Number of Customers by Month”, “Number of Orders by Month”)
Chúng ta có thể tạo ra cột title ngay từ đầu khi tạo bảng “Disconnected_table

⦁ Bước 2: Trong tùy chọn Title ở phần Format. Ta chọn biểu tượng fx

Tùy chọn Title
Tùy chon Title ở Format

Tại hộp thoại Title text, tại Based on filed, chọn cột “title” trong bảng “Disconnected_table

Chọn cột Title
Chọn cột “title” trong bảng “Disconnected_table

Kết quả ta được

Tham khảo kết quả tại: Dynamic measure report


Ví dụ trên chúng ta chỉ có 2 measure, trong bài toán thực tế, các bạn có thể tạo ra dynamic measure gồm nhiều loại measure khác nhau.

Nội dung sắp tới, chúng ta sẽ cùng nghĩ cách để có thể thực hiện conditional formating với những visual đang sử dụng dynamic measure.

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn
Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos
Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher
Posted on Leave a comment

Hướng dẫn xây dựng Cohort Analysis trên Power BI

Cohort Analysis

Cohort Analysis là gì

Cohort Analysis (Phân tích tổ hợp) là một kỹ thuật phân tích tập trung vào việc phân tích hành vi của một nhóm người dùng / khách hàng có chung một đặc điểm trong một khoảng thời gian nhất định.

Trong phân tích kinh doanh, New Customer được xem là một tiêu chí quan trọng để đánh giá tình hình kinh doanh của doanh nghiệp. Ở một góc nhìn khác, New Customer thể hiện hiệu quả của đội ngũ bán hàng và phần nào đó là hiệu quả trong Marketing. Một chỉ số không kém phần quan trọng là Retention Customer – chỉ số cho thấy khả năng giữ chân khách hàng của một dịch vụ. Retention Rate càng cao càng cho thấy mức độ trung thành của khách hàng đối với dịch vụ của doanh nghiệp. Một chỉ số ở chiều ý nghĩa ngược lại với retention là Churn Rate. Đây là 2 trong số những key metrics rất được quan tâm trong business. Định nghĩa về Retention hay Churn phụ thuộc vào cách mà mỗi business định nghĩa.  

Thông thường, người ta sử dụng Cohort Analysis để thể hiện chỉ số Retention Rate/Churn Rate.  

Trong bài này, Datapot giới thiệu đến người đọc cách xây dựng Cohort Analysis trên Power BI.  

Download file Power BI tại Tại đây

(Tham khảo Các thao tác đơn giản để tạo báo cáo trên Power BI cho người mới bắt đầu tại Các thao tác đơn giản để tạo báo cáo trên Power BI cho người mới bắt đầu – Datapot.vn )

Xây dựng Cohort Analysis trên Power BI

Giả sử chúng ta có một bảng dữ liệu có tên là “SalesTable” bao gồm 3 cột:  

  • Customerkey: Cột chứa key định danh cho mỗi khách hàng mua dịch vụ.  
  • OrderDate: Ngày ngày hàng có đặt hàng dịch vụ  
  • OrderMonth: Tháng mà khách hàng có đặt hàng dịch vụ  

Ngoài ra ta cũng có 1 bảng “Date”, có relationship với bảng “SalesTable”  thông qua cột Date và OrderDate 

Power BI
Bảng SalesTable
Relationship trong Power BI
Mối quan hệ giữa Bảng Date và Bảng SalesTable
  • Tính số lượng khách hàng có order hằng tháng 

No.Customer = DISTINCTCOUNT(‘SalesTable'[Customerkey]) 

Cohort Analysis
Số lượng khách hàng có order hằng tháng
  • Tính số lượng khách hàng mới có order hằng tháng  

Ở trên, chúng ta đang tính toán số lượng khách hàng có phát sinh giao dịch trong tháng. Vậy trong số những khách hàng có phát sinh giao dịch đó, có bao nhiêu là khách hàng mới hoàn toàn, chưa từng mua hàng trước đó.  

Logic tính toán sẽ là, nếu một khách hàng là khách hàng mới trong tháng xem xét thì ngày đầu tiên có giao dịch của khách hàng đó sẽ là ngày thuộc tháng đang xem xét. 

  • Trong bảng SalesTable, tạo ra 1 calculated column có tên là “FirstOrderMonth” là tháng đầu tiên mà 1 khách hàng có order:  

FirstOrderMonth =  

    CALCULATE( 

       MIN(SalesTable[OrderMonth]),  

       FILTER(SalesTable, SalesTable[Customerkey] = EARLIER(SalesTable[Customerkey]))) 

  • Tạo measure “No.NewCustomer” tính số lượng khách hàng mới  

No.NewCustomer =  

    CALCULATE( 

     DISTINCTCOUNT(SalesTable[Customerkey]),  

     FILTER(SalesTable, SalesTable[FirstOrderMonth] = SalesTable[OrderMonth])) 

Power BI
Số lượng khách hàng và Số lượng khách hàng mới
  • Cohort Analysis thể hiện retention rate  

Với ví dụ của chúng ta, nếu định nghĩa đơn giản, retention rate là tỉ lệ khách hàng cũ có mua hàng trong tháng mới trên tổng số khách hàng cũ.  

Mục tiêu là chúng ta muốn tạo 1 matrix như bên dưới, đây được gọi là 1 cohort. Cohort cho biết số lượng khách hàng mới và số lượng khách hàng có tiếp tục order ở các tháng tiếp theo.  

Trong cohort bên dưới, dòng là tháng bắt đầu có order, cột là các tháng sau đó. Để hiểu cách đọc cohort, ta hiểu ý nghĩa của các con số bên trong. Ví dụ 498 là số lượng khách hàng mới trong tháng 6/2018, sau đó, trong tháng 7/2019, chỉ có 3 khách hàng trong tổng số 498 khách hàng mới của tháng 6 là có order. Trong tháng 7/2019, chúng ta có 1506 khách hàng mới,  xem xét tại tháng 12/2019, chỉ có 89 trên 1506 khách hàng mới là có order.  

Cohort Analysis thể hiện retention rate
Cohort Analysis thể hiện retention rate

Sau khi hình dung được ý nghĩa của cohort, chúng ta tiếp tục phân tích xem để tạo được cohort như trên sẽ cần phải chuẩn bị những gì.  

Thứ nhất, chúng ta cần 1 trường thông tin thể hiện được tháng khách hàng bắt đầu có giao dịch. Đây chính là cột “FirstOrderMonth” mà chúng ta đã tạo ra ở phần trên.  

Thứ hai, chúng ta cần có 1 trường để kéo vào làm column cho cohort. Chúng ta tận dùng cột “Month”  trong bảng “Date”.  

Thứ ba, chúng ta cần viết 1 measure để kéo vào phần value trong cohort.  

Dựa trên dữ liệu đang sử dụng, để tạo được cohort như trên, ta làm theo các bước sau: 

  • Bước 1 : Tạo thêm 1 cột là “FirstOrderMonth” bằng cách format lại cột “FirstOrderMonth” trong bảng “SalesTable” 

FirstOrderMonth_1 = FORMAT(SalesTable[FirstOrderMonth], “yyyy mmm”) 

  • Bước 2: Viết measure để tính toán  

No.NewCustomer by Cohort =  

    CALCULATE( 

     DISTINCTCOUNT(SalesTable[Customerkey]),  

       filter(SalesTable, SalesTable[OrderDate] >= MIN(‘Date'[Date]) && SalesTable[OrderDate] <= MAX(‘Date'[Date]))) 

MIN(‘Date'[Date]) và MAX(‘Date'[Date]) tại mỗi cột sẽ trả về giá trị là ngày đầu tiên và ngày cuối cùng của tháng. Tức là nếu trong cột của matrix là tháng tháng 6 thì hàm min và max sẽ trả về ngày 1/6/2019 và ngày 30/6/2019. Tức là với đoạn code này filter(SalesTable, SalesTable[OrderDate] >= MIN(‘Date'[Date]) && SalesTable[OrderDate] <= MAX(‘Date'[Date])), tại mỗi cột trong matrix, chúng ta chỉ filter dữ liệu của bảng “SalesTable” trong tháng đang xem xét.  

  • Bước 3: Tạo matrix 

Tạo matrix và kéo cột “FirstOrderMonth_1” trong bảng “SalesTable” vào Rows option. Cột “month” trong bảng “Date” vào Columns option. Measure No.NewCustomer by Cohort vào trong phần Values options. Ngoài ra có thể đổi lại tên “FirstOrderMonth_1” thành “First Order Month” để khi hiển thị trong matrix nó rõ ràng hơn. 

Matrix trong Cohort Analysis
Tạo Matrix
  • Bước 4: Conditonal Formating cho matrix 

Format Cohort Analysis
Conditonal Formating cho matrix
  • Bước 5: Sort lại cột “FirstOrderMonth_1” theo cột “FirstOrderMonth” – Hoàn thành Cohort Analysis

Có thể thấy trong matrix kết quả, các dòng đang không theo thứ tự đúng do “FirstOrderMonth_1” là dạng text nên bị sort theo thứ tự a-z.  Trong bảng “SalesTable”, ta sort cột “FirstOrderMonth_1” theo cột “FirstOrderMonth”. Click vào cột cần sort, sau đó chọn tùy chọn Sort by column, click tiếp vào cột mà muốn “FirstOrderMonth_1” sort theo nó.  

Cohort Analysis trong Power BI
Sort lại cột “FirstOrderMonth_1” theo cột “FirstOrderMonth” 

Kết quả, ta được một cohort như ý muốn:  

Kết quả Cohort Analysis
Kết quả Cohort

Lưu ý: chúng ta sẽ cần một slicer Date để giới hạn số lượng cột xuất hiện trong Cohort.  

Trên đây là hướng dẫn làm 1 cohort dựa trên dữ liệu mẫu. Người đọc tham khảo để hiểu cách làm, từ đó có thể phát triển các cohort theo mong muốn.  

Ví dụ Cohort Analysis
Ví dụ Cohort
Phân tích Cohort
Ví dụ Cohort

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn
Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos
Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher
Posted on 1 Comment

HƯỚNG DẪN ĐĂNG KÝ THI CHỨNG CHỈ DA-100

DAA

Chứng chỉ DAA (Microsoft Data Analytics Certification) là một chứng chỉ cần thiết đối với các Data Analyst và cũng là tấm vé cho các bạn muốn bước chân vào ngành Khoa học Dữ liệu. Để có được chứng chỉ DAA, các bạn sẽ phải tham gia Bài thi DA-100, một data analysis test/ Power BI exam đến từ Microsoft. Nếu bạn có ý định dự thi DA-100 nhưng chưa biết làm sao để đăng ký  thì hãy theo dõi bài viết của Datapot để có thể làm thủ tục dự thi nhanh nhất và tránh những sự cố không đáng có nhé.

Tham khảo các Chủ đề trong bài thi DA-100 tại: KINH NGHIỆM THI DA-100: CÁC TOPICS TRONG BÀI THI DA-100 – Datapot.vn

data analyst certification microsoft

Những điều cần lưu ý

  • Điều kiện để đăng ký thi

Bạn cần đảm bảo rằng bạn đã có một Tài khoản Microsoft đã điền đầy đủ và chính xác thông tin cá nhân nha.

  • Địa điểm thi

Bạn có thể lựa chọn địa điểm thi tại nhà, cơ quan, địa chỉ lưu trú hoặc Trung tâm được ủy quyền bởi Microsoft. Nhưng lưu ý, nếu bạn lựa chọn thi tại cơ quan, hãy ưu tiên sử dụng máy tính cá nhân, tránh sử dụng máy tính tại văn phòng/máy tính nội bộ vì có thể gặp những hạn chế về cơ chế bảo mật, ảnh hưởng đến việc cài đặt các phần mềm giám sát bài thi sau này.

Cách thức đăng ký thi

  1. Truy cập vào link đăng ký chứng chỉ tại

https://docs.microsoft.com/en-us/learn/certifications/exams/da-100
Page đăng ký thi DA-100
Page đăng ký thi DA-100
  1. Chọn quốc gia:

 – Chọn quốc gia “Việt Nam”. Lưu ý lệ phí thi chứng chỉ sẽ khác nhau phụ thuộc vào từng quốc gia

 – Click “Schedule for USD15” để tiến hành điền thông tin và đặt lịch: Hiện tại Microsoft đang giảm lệ phí thi từ 80 – 15 USD trong thời gian Covid đến 31/12/2021). 

Schedule for USD15
Chọn Schedule for USD15
  1. Chọn “I Agree” để đồng ý với các điều khoản

Đồng ý với các điều khoản
  1. Điền các thông tin cá nhân cần thiết để đăng ký chứng chỉ

 Lưu ý: Nhập thông tin cá nhân chính xác như trên giấy tờ tùy thân, thông tin này sẽ được đối chiếu khi tham dự kỳ thi. Các thông tin hợp lệ phải khớp với giấy tờ tùy thân 

Điền thông tin cá nhân để đăng ký chứng chỉ
Điền thông tin cá nhân để đăng ký chứng chỉ
  • Điền các trường thông tin cần thiết
  • Tích chọn “I have read and agree the Terms of Use and Privacy & Cookies statement
  • Chọn “Save & Continue
  • Kiểm tra lại thông tin và chọn “Accept
thông tin cá nhân phải chính xác
Lưu ý thông tin cá nhân phải chính xác như trên giấy tờ tùy thân
  • Chọn “Schedule Exam” Để đăng ký lịch thi
Đăng ký lịch thi
Đăng ký lịch thi
  1. Đăng ký lịch thi

 – Sau khi Chọn “Schedule Exam” ở bước 4, có thể các bạn sẽ gặp 1 thông báo cần cấp quyền cho các App sau để Verified thông tin, chọn “Yes” để tiếp tục

Cấp quyền cho App để verify thông tin
Cấp quyền cho App để verify thông tin
  • Chọn “Schedule
  • Chọn thông tin để đăng ký lịch thi, bao gồm:
    • 1. Chọn ngôn ngữ bài thi
    • 2. Chọn quốc gia
    • 3. Chọn múi giờ
    • 4. Chọn ngày thi
    • 5. Chọn khung giờ thi
  • Sau khi hoàn thành, chọn “Continue” để tiếp tục
Chọn thông tin để đăng ký lịch thi
Chọn thông tin để đăng ký lịch thi
  • Kiểm tra lại thông tin khung thời gian bài thi, chọn “Continue” để xác nhận
Xác nhận lại khung thời gian thi
Xác nhận lại khung thời gian thi
  1. Thanh toán lệ phí thi

 Sau khi đặt lịch thi ở bước 5, bạn sẽ được chuyển sang giao diện để thanh toán lệ phí thi. Tích chọn và chọn “Pay Now” để tiếp tục

Payment DA-100
Giao diện thanh toán lệ phí thi
  • Điền thông tin tài khoản thanh toán
  • Tích Verification
  • Chọn “Pay Now

Lưu ý: Lịch đăng ký thi của bạn sẽ hết hạn sau 30 ngày nếu không được thanh toán lệ phí thành công

Payment
Hoàn tất thanh toán

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn

Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos

Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher