Posted on Leave a comment

Hướng dẫn xây dựng Cohort Analysis trên Power BI

Cohort Analysis

Cohort Analysis là gì

Cohort Analysis (Phân tích tổ hợp) là một kỹ thuật phân tích tập trung vào việc phân tích hành vi của một nhóm người dùng / khách hàng có chung một đặc điểm trong một khoảng thời gian nhất định.

Trong phân tích kinh doanh, New Customer được xem là một tiêu chí quan trọng để đánh giá tình hình kinh doanh của doanh nghiệp. Ở một góc nhìn khác, New Customer thể hiện hiệu quả của đội ngũ bán hàng và phần nào đó là hiệu quả trong Marketing. Một chỉ số không kém phần quan trọng là Retention Customer – chỉ số cho thấy khả năng giữ chân khách hàng của một dịch vụ. Retention Rate càng cao càng cho thấy mức độ trung thành của khách hàng đối với dịch vụ của doanh nghiệp. Một chỉ số ở chiều ý nghĩa ngược lại với retention là Churn Rate. Đây là 2 trong số những key metrics rất được quan tâm trong business. Định nghĩa về Retention hay Churn phụ thuộc vào cách mà mỗi business định nghĩa.  

Thông thường, người ta sử dụng Cohort Analysis để thể hiện chỉ số Retention Rate/Churn Rate.  

Trong bài này, Datapot giới thiệu đến người đọc cách xây dựng Cohort Analysis trên Power BI.  

Download file Power BI tại Tại đây

(Tham khảo Các thao tác đơn giản để tạo báo cáo trên Power BI cho người mới bắt đầu tại Các thao tác đơn giản để tạo báo cáo trên Power BI cho người mới bắt đầu – Datapot.vn )

Xây dựng Cohort Analysis trên Power BI

Giả sử chúng ta có một bảng dữ liệu có tên là “SalesTable” bao gồm 3 cột:  

  • Customerkey: Cột chứa key định danh cho mỗi khách hàng mua dịch vụ.  
  • OrderDate: Ngày ngày hàng có đặt hàng dịch vụ  
  • OrderMonth: Tháng mà khách hàng có đặt hàng dịch vụ  

Ngoài ra ta cũng có 1 bảng “Date”, có relationship với bảng “SalesTable”  thông qua cột Date và OrderDate 

Power BI
Bảng SalesTable
Relationship trong Power BI
Mối quan hệ giữa Bảng Date và Bảng SalesTable
  • Tính số lượng khách hàng có order hằng tháng 

No.Customer = DISTINCTCOUNT(‘SalesTable'[Customerkey]) 

Cohort Analysis
Số lượng khách hàng có order hằng tháng
  • Tính số lượng khách hàng mới có order hằng tháng  

Ở trên, chúng ta đang tính toán số lượng khách hàng có phát sinh giao dịch trong tháng. Vậy trong số những khách hàng có phát sinh giao dịch đó, có bao nhiêu là khách hàng mới hoàn toàn, chưa từng mua hàng trước đó.  

Logic tính toán sẽ là, nếu một khách hàng là khách hàng mới trong tháng xem xét thì ngày đầu tiên có giao dịch của khách hàng đó sẽ là ngày thuộc tháng đang xem xét. 

  • Trong bảng SalesTable, tạo ra 1 calculated column có tên là “FirstOrderMonth” là tháng đầu tiên mà 1 khách hàng có order:  

FirstOrderMonth =  

    CALCULATE( 

       MIN(SalesTable[OrderMonth]),  

       FILTER(SalesTable, SalesTable[Customerkey] = EARLIER(SalesTable[Customerkey]))) 

  • Tạo measure “No.NewCustomer” tính số lượng khách hàng mới  

No.NewCustomer =  

    CALCULATE( 

     DISTINCTCOUNT(SalesTable[Customerkey]),  

     FILTER(SalesTable, SalesTable[FirstOrderMonth] = SalesTable[OrderMonth])) 

Power BI
Số lượng khách hàng và Số lượng khách hàng mới
  • Cohort Analysis thể hiện retention rate  

Với ví dụ của chúng ta, nếu định nghĩa đơn giản, retention rate là tỉ lệ khách hàng cũ có mua hàng trong tháng mới trên tổng số khách hàng cũ.  

Mục tiêu là chúng ta muốn tạo 1 matrix như bên dưới, đây được gọi là 1 cohort. Cohort cho biết số lượng khách hàng mới và số lượng khách hàng có tiếp tục order ở các tháng tiếp theo.  

Trong cohort bên dưới, dòng là tháng bắt đầu có order, cột là các tháng sau đó. Để hiểu cách đọc cohort, ta hiểu ý nghĩa của các con số bên trong. Ví dụ 498 là số lượng khách hàng mới trong tháng 6/2018, sau đó, trong tháng 7/2019, chỉ có 3 khách hàng trong tổng số 498 khách hàng mới của tháng 6 là có order. Trong tháng 7/2019, chúng ta có 1506 khách hàng mới,  xem xét tại tháng 12/2019, chỉ có 89 trên 1506 khách hàng mới là có order.  

Cohort Analysis thể hiện retention rate
Cohort Analysis thể hiện retention rate

Sau khi hình dung được ý nghĩa của cohort, chúng ta tiếp tục phân tích xem để tạo được cohort như trên sẽ cần phải chuẩn bị những gì.  

Thứ nhất, chúng ta cần 1 trường thông tin thể hiện được tháng khách hàng bắt đầu có giao dịch. Đây chính là cột “FirstOrderMonth” mà chúng ta đã tạo ra ở phần trên.  

Thứ hai, chúng ta cần có 1 trường để kéo vào làm column cho cohort. Chúng ta tận dùng cột “Month”  trong bảng “Date”.  

Thứ ba, chúng ta cần viết 1 measure để kéo vào phần value trong cohort.  

Dựa trên dữ liệu đang sử dụng, để tạo được cohort như trên, ta làm theo các bước sau: 

  • Bước 1 : Tạo thêm 1 cột là “FirstOrderMonth” bằng cách format lại cột “FirstOrderMonth” trong bảng “SalesTable” 

FirstOrderMonth_1 = FORMAT(SalesTable[FirstOrderMonth], “yyyy mmm”) 

  • Bước 2: Viết measure để tính toán  

No.NewCustomer by Cohort =  

    CALCULATE( 

     DISTINCTCOUNT(SalesTable[Customerkey]),  

       filter(SalesTable, SalesTable[OrderDate] >= MIN(‘Date'[Date]) && SalesTable[OrderDate] <= MAX(‘Date'[Date]))) 

MIN(‘Date'[Date]) và MAX(‘Date'[Date]) tại mỗi cột sẽ trả về giá trị là ngày đầu tiên và ngày cuối cùng của tháng. Tức là nếu trong cột của matrix là tháng tháng 6 thì hàm min và max sẽ trả về ngày 1/6/2019 và ngày 30/6/2019. Tức là với đoạn code này filter(SalesTable, SalesTable[OrderDate] >= MIN(‘Date'[Date]) && SalesTable[OrderDate] <= MAX(‘Date'[Date])), tại mỗi cột trong matrix, chúng ta chỉ filter dữ liệu của bảng “SalesTable” trong tháng đang xem xét.  

  • Bước 3: Tạo matrix 

Tạo matrix và kéo cột “FirstOrderMonth_1” trong bảng “SalesTable” vào Rows option. Cột “month” trong bảng “Date” vào Columns option. Measure No.NewCustomer by Cohort vào trong phần Values options. Ngoài ra có thể đổi lại tên “FirstOrderMonth_1” thành “First Order Month” để khi hiển thị trong matrix nó rõ ràng hơn. 

Matrix trong Cohort Analysis
Tạo Matrix
  • Bước 4: Conditonal Formating cho matrix 

Format Cohort Analysis
Conditonal Formating cho matrix
  • Bước 5: Sort lại cột “FirstOrderMonth_1” theo cột “FirstOrderMonth” – Hoàn thành Cohort Analysis

Có thể thấy trong matrix kết quả, các dòng đang không theo thứ tự đúng do “FirstOrderMonth_1” là dạng text nên bị sort theo thứ tự a-z.  Trong bảng “SalesTable”, ta sort cột “FirstOrderMonth_1” theo cột “FirstOrderMonth”. Click vào cột cần sort, sau đó chọn tùy chọn Sort by column, click tiếp vào cột mà muốn “FirstOrderMonth_1” sort theo nó.  

Cohort Analysis trong Power BI
Sort lại cột “FirstOrderMonth_1” theo cột “FirstOrderMonth” 

Kết quả, ta được một cohort như ý muốn:  

Kết quả Cohort Analysis
Kết quả Cohort

Lưu ý: chúng ta sẽ cần một slicer Date để giới hạn số lượng cột xuất hiện trong Cohort.  

Trên đây là hướng dẫn làm 1 cohort dựa trên dữ liệu mẫu. Người đọc tham khảo để hiểu cách làm, từ đó có thể phát triển các cohort theo mong muốn.  

Ví dụ Cohort Analysis
Ví dụ Cohort
Phân tích Cohort
Ví dụ Cohort

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn
Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos
Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher
Posted on 1 Comment

HƯỚNG DẪN ĐĂNG KÝ THI CHỨNG CHỈ DA-100

DAA

Chứng chỉ DAA (Microsoft Data Analytics Certification) là một chứng chỉ cần thiết đối với các Data Analyst và cũng là tấm vé cho các bạn muốn bước chân vào ngành Khoa học Dữ liệu. Để có được chứng chỉ DAA, các bạn sẽ phải tham gia Bài thi DA-100, một data analysis test/ Power BI exam đến từ Microsoft. Nếu bạn có ý định dự thi DA-100 nhưng chưa biết làm sao để đăng ký  thì hãy theo dõi bài viết của Datapot để có thể làm thủ tục dự thi nhanh nhất và tránh những sự cố không đáng có nhé.

Tham khảo các Chủ đề trong bài thi DA-100 tại: KINH NGHIỆM THI DA-100: CÁC TOPICS TRONG BÀI THI DA-100 – Datapot.vn

data analyst certification microsoft

Những điều cần lưu ý

  • Điều kiện để đăng ký thi

Bạn cần đảm bảo rằng bạn đã có một Tài khoản Microsoft đã điền đầy đủ và chính xác thông tin cá nhân nha.

  • Địa điểm thi

Bạn có thể lựa chọn địa điểm thi tại nhà, cơ quan, địa chỉ lưu trú hoặc Trung tâm được ủy quyền bởi Microsoft. Nhưng lưu ý, nếu bạn lựa chọn thi tại cơ quan, hãy ưu tiên sử dụng máy tính cá nhân, tránh sử dụng máy tính tại văn phòng/máy tính nội bộ vì có thể gặp những hạn chế về cơ chế bảo mật, ảnh hưởng đến việc cài đặt các phần mềm giám sát bài thi sau này.

Cách thức đăng ký thi

  1. Truy cập vào link đăng ký chứng chỉ tại

https://docs.microsoft.com/en-us/learn/certifications/exams/da-100
Page đăng ký thi DA-100
Page đăng ký thi DA-100
  1. Chọn quốc gia:

 – Chọn quốc gia “Việt Nam”. Lưu ý lệ phí thi chứng chỉ sẽ khác nhau phụ thuộc vào từng quốc gia

 – Click “Schedule for USD15” để tiến hành điền thông tin và đặt lịch: Hiện tại Microsoft đang giảm lệ phí thi từ 80 – 15 USD trong thời gian Covid đến 31/12/2021). 

Schedule for USD15
Chọn Schedule for USD15
  1. Chọn “I Agree” để đồng ý với các điều khoản

Đồng ý với các điều khoản
  1. Điền các thông tin cá nhân cần thiết để đăng ký chứng chỉ

 Lưu ý: Nhập thông tin cá nhân chính xác như trên giấy tờ tùy thân, thông tin này sẽ được đối chiếu khi tham dự kỳ thi. Các thông tin hợp lệ phải khớp với giấy tờ tùy thân 

Điền thông tin cá nhân để đăng ký chứng chỉ
Điền thông tin cá nhân để đăng ký chứng chỉ
  • Điền các trường thông tin cần thiết
  • Tích chọn “I have read and agree the Terms of Use and Privacy & Cookies statement
  • Chọn “Save & Continue
  • Kiểm tra lại thông tin và chọn “Accept
thông tin cá nhân phải chính xác
Lưu ý thông tin cá nhân phải chính xác như trên giấy tờ tùy thân
  • Chọn “Schedule Exam” Để đăng ký lịch thi
Đăng ký lịch thi
Đăng ký lịch thi
  1. Đăng ký lịch thi

 – Sau khi Chọn “Schedule Exam” ở bước 4, có thể các bạn sẽ gặp 1 thông báo cần cấp quyền cho các App sau để Verified thông tin, chọn “Yes” để tiếp tục

Cấp quyền cho App để verify thông tin
Cấp quyền cho App để verify thông tin
  • Chọn “Schedule
  • Chọn thông tin để đăng ký lịch thi, bao gồm:
    • 1. Chọn ngôn ngữ bài thi
    • 2. Chọn quốc gia
    • 3. Chọn múi giờ
    • 4. Chọn ngày thi
    • 5. Chọn khung giờ thi
  • Sau khi hoàn thành, chọn “Continue” để tiếp tục
Chọn thông tin để đăng ký lịch thi
Chọn thông tin để đăng ký lịch thi
  • Kiểm tra lại thông tin khung thời gian bài thi, chọn “Continue” để xác nhận
Xác nhận lại khung thời gian thi
Xác nhận lại khung thời gian thi
  1. Thanh toán lệ phí thi

 Sau khi đặt lịch thi ở bước 5, bạn sẽ được chuyển sang giao diện để thanh toán lệ phí thi. Tích chọn và chọn “Pay Now” để tiếp tục

Payment DA-100
Giao diện thanh toán lệ phí thi
  • Điền thông tin tài khoản thanh toán
  • Tích Verification
  • Chọn “Pay Now

Lưu ý: Lịch đăng ký thi của bạn sẽ hết hạn sau 30 ngày nếu không được thanh toán lệ phí thành công

Payment
Hoàn tất thanh toán

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn

Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos

Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher

Posted on 1 Comment

KINH NGHIỆM THI DA-100: CÁC TOPICS TRONG BÀI THI DA-100

DAA

Bạn đang làm Data Analyst và muốn nâng cao chuyên môn? Bạn muốn chuyển ngành và muốn bước chân và ngành Khoa học Dữ liệu? Chứng chỉ DAA (microsoft data analytics certification) sẽ là tấm vé cho bạn. Bài thi DA-100 là một data analysis test/ Power BI exam đến từ Microsoft. Nếu bạn muốn thi DA-100 nhưng không biết bắt đầu từ đâu, hãy theo dõi bài viết của Datapot để có cái nhìn chuẩn xác và hướng đi nhanh nhất chinh phục kỳ thi này nhé.

Tham khảo Hướng dẫn đăng ký thi DA-100 tại: HƯỚNG DẪN ĐĂNG KÝ THI CHỨNG CHỈ DA-100 – Datapot.vn

data analyst certification microsoft

Cấu trúc bài thi DA-100

Đề thi DA-100 của Microsoft bao gồm 5 chủ đề chính với tỉ trọng điểm số như sau: 

  • Prepare the data (20-25%) 
  • Model the data (25-30%) 
  • Visualize the data (20-25%) 
  • Analyze the data (10-15%) 
  • Deploy and maintain deliverables (10-15%) 

Các bạn có thể download đề cương kỹ năng tại đây: https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu 

Sau đây, chúng ta sẽ đi sâu hơn về ý nghĩa và các nội dung cần học trong từng Topic cụ thể  

Topic 1: Prepare the data – Chuẩn bị dữ liệu

Prepare the data là topic chiếm từ 20 – 25% tổng điểm của bài thi. Đây là phần việc cơ bản nhưng không kém quan trọng khi data analyst làm việc với dữ liệu, không chỉ trên Power BI mà còn với các công cụ, ngôn ngữ khác. Prepare the data trong Power BI là quá trình bao gồm các phần việc chính sau: Get data from different data sources — > Profile the data — > Clean, transform, and load the data

Ôn thi DA-100
3 nhiệm vụ của Prepare the data trong Power BI

  • Get data from different data sources 

Có rất nhiều loại dữ liệu khác nhau trong một tổ chức, doanh nghiệp và nó cũng được lưu trữ ở nhiều nguồn khác nhau. Đơn giản có thể là Excel, CSV, tổ chức hơn thì là trong các hệ cơ sở quản trị dữ liệu như MS SQL, MySQL…, hay trên các cloud như Google bigquery, Microsoft Azure. Với phần này, chúng ta cần nắm được cách xác định và kết nối đến nguồn dữ liệu, ngoài ra làm sao để thay đổi setting đối với nguồn dữ liệu.  

Ví dụ: Các bảng có cùng định dạng excel đang lưu trong 1 folder chung. Làm sao để import tất cả đồng thời và nối chúng lại thành 1 bảng duy nhất?  

  • Profile the data 

Dữ liệu luôn có thể tồn tại những vấn đề của chính nó, có thể là thiếu dữ liệu ở 1 số cột dữ liệu nào đó, hoặc liệu có thể tồn tại outlier. Bước Profile the data là bước cần thiết để chúng ta nhìn nhận dữ liệu một cách tổng quan và tìm ra những vấn đề của dữ liệu nếu có, từ đó có hướng xử lý tiếp theo. Ở phần này, chúng ta cần biết được khi nào thì sử dụng.  

Ví dụ: Để xác định được tỉ lệ missing thì cần dùng tùy chọn nào trong Power Query Editor? (Data Quality) Hay để xác định được phân bố dữ liệu thì dùng tùy chọn nào? (Column Distribution)

  • Clean, transform, and load the data 

Dữ liệu sau khi được import vào có thể chưa được sạch, tinh gọn và có thể chưa đáp ứng nhu cầu phân tích, báo cáo về sau. Clean và transform gần như là bước không thể thiếu khi làm việc với dữ liệu trên Power BI. Sau khi thao tác làm sạch, biến đổi theo mong muốn, chúng ta cần load dữ liệu vào data model để phục vụ tiếp các phần sau.

Tại phần việc này, chúng ta cần nắm được các thao tác định dạng dữ liệu, fill dữ liệu, đặt header, xóa dòng xóa cột, split, transpose, merge, append data, các phép join … Bên cạnh đó, một chút kiến thức cơ bản về Power Query M code là cần thiết.  

Ví dụ: Bảng dữ liệu về doanh số bán hàng có tên là “Sales.xlsx” sau khi import, tên cột của bảng đang trở thành dòng thứ nhất của bảng dữ liệu. Bên cạnh đó có cột price đang có định dạng text, với giá trị bên trong có format “$ 100”. Dùng những lệnh nào để có thể đặt lại header cho bảng và tách cột giá thành 2 cột là currency có dạng “$”. Cột còn lại tên là price_1 chính là giá trị số (ví dụ số 100) trong chính cột price ban đầu. (User first row as header, Split) 

Topic 2: Model the data – Lập mô hình dữ liệu 

Kiến thức và kĩ năng về Model the data là quan trọng bậc nhất và tất nhiên cũng là khó nhằn nhất trong Power BI exam. Trọng số cho phần này là 25 – 30% tổng điểm của bài thi DA-100. Model the data được chia thành 4 nhóm nội dung chính.  

Bài thi DA-100
4 nhóm nội dung chính của Model the data

  • Design a data model 

Việc đầu tiên sau khi load dữ liệu chính là thiết kế data model. Data model nói một cách đơn giản, chúng ta xây dựng mối quan hệ giữa các bảng dữ liệu. Với phần này, data analyst cần nắm được 1 số kiến thức về các tính chất của bảng, cột, quick measures, hierarchy, role-playing dimensions, cardinality and cross-filter direction trong 1 relationship.

  • Develop a data model 

Sau khi design một data model cơ bản dựa trên những gì chúng ta có sau khi load dữ liệu. Chúng ta có thể phát triển, mở rộng data model thông qua việc tạo thêm các calculated column, calculated table, hierarchies… Phần việc này thường cần thiết, khi data model sẵn có có thể không đáp ứng được nhu cầu báo cáo. Với phần này, chúng ta cần nắm được kiến thức, kĩ năng tạo hierarchy, calculated column, calculated table. Bên cạnh đó 1 số kiến thức về cross-filter direction and security filtering, row-level security roles, object-level security. 

  • Create measures by using DAX 

Power BI cung cấp cho chúng ta các Implicit Measure thông qua kéo thả cột khi visualization. Tuy nhiên nhu cầu tạo ra những chỉ số phức tạp hơn, giúp báo cáo có thêm các góc nhìn mới mẻ hơn, khi đó chúng ta cần sử dụng DAX để tạo ra measures. Cần ôn tập một số nhóm DAX function thường gặp khi xử lý với dữ liệu text, string, aggregate. Bên cạnh đó là nhóm hàm liên quan đến Calculate để thể hiện filter context trong DAX. Nhóm hàm Time Intelligence cũng đáng chú ý.   

  • Optimize model performance 

Khi data model nhẹ, Optimize model performance có thể chưa phải là vấn đề đối với bạn. Tuy nhiên, khi chúng ta có những bảng dữ liệu rất lớn, data model phức tạp, sử dụng nhiều measure phức tạp khiến việc tính toán, xử lý bị chậm, đấy là lúc chúng ta cần nghĩ đến tối ưu model performance. Đơn giản, chúng ta loại đi những cột không cần thiết, filter những dòng dữ liệu không sử dụng cho báo cáo, ví dụ như data quá khứ từ rất xa chẳng hạn. Tốn nhiều công sức hơn 1 chút, chúng ta review lại code DAX xem đã tối ưu chưa. 

Topic 3: Visualize the Data – Trực quan hóa dữ liệu

Sau khi đã có được data model tạm thời như ý (thực tế phải update rất nhiều) thì chúng ta bắt tay làm một số việc mà nhiều người học Power BI sẽ hào hứng nhất, đó chính là visualize. Nói đơn giản, chúng ta tạo các bảng, biểu đồ để trả lời cho những câu hỏi mà chúng ta, hoặc sếp của chúng ta đặt ra. Phần này chiếm đến 20 – 25% tổng điểm của bài thi DA-100. Rất quan trọng. Các nội dung bao gồm: Create Reports, Create Dashboards, Enrich reports for usability.

Kinh nghiêm thi DA-100
3 nội dung chính của Visualize the data

  • Create Reports 

Chúng ta sẽ tạo ra những bảng, biểu đồ phù hợp để trả lời các câu hỏi. Ví dụ: Muốn biết xu thế tăng hay giảm doanh thu qua các tháng, hay sự tăng trưởng doanh thu so với cùng kì năm trước… Với phần này, chúng ta cần nắm được các loại bảng, biểu, cách dùng của nó phù hợp với những tình huống, trả lời cho những câu hỏi nào. Với mỗi loại visual cụ thể, chúng ta cần biết đưa cột (field) nào vào. Một số kiến thức về format, apply filter…  

  • Create Dashboards 

Dashboard là tập hợp của nhiều report. Một số kiến thức cần ôn tập như là set mobile view, manage tiles on a dashboard, configure data alerts, use the Q&A feature, add a dashboard theme, pin a live report page to a dashboard. 

  • Enrich reports for usability 

Chúng ta có thể tạo 1 số thiết lập để giúp báo cáo dễ xem hơn, dễ dàng trình diễn dữ liệu hơn đối với người xem (end user). Một số kiến thức cần ôn tập như bookmark, tooltip, Interaction giữa các visual trong cùng 1 page, sorting, drillthrough and cross filter, export data…

Topic 4: Analyze the Data – Phân tích dữ liệu

Các câu hỏi về Analyze Data chiếm 10 – 15% tổng điểm của bài thi Chứng chỉ DA-100. Analyze the data giúp chúng ta tìm kiếm được những insight, điểm nhấn từ dữ liệu, từ rất nhiều bảng biểu đã tạo trước đó. Đây cũng là phần tạo ra sự khác biệt giữa chúng ta so với những người dùng Power BI khác. Có 2 nội dung chính: Enhance reports to expose insights và Perform advanced analysis.

Chứng chỉ DA-100
2 nội dung chính trong Analyze the data

  • Enhance reports to expose insights 

Các câu hỏi có thể liên quan đến conditional formatting, áp dụng slicer, filters, Top N, Q&A visual, … 

  • Perform advanced analysis 

Các câu hỏi có thể liên quan đến cách xác định outliers, time series analysis, sử dụng groupings và binnings, Key Influencers to explore dimensional variances, decomposition tree visual, Al insights.  

Topic 5: Deploy and Maintain Deliverables – Triển khai và duy trì các sản phẩm đã giao

Các câu hỏi liên quan đến giai đoạn sau khi hoàn thiện dashboard chiếm khoảng 10 – 15% tổng điểm của bài thi. Có thể chia topic này thành 2 phần nội dung chính: Manage datasets và Create and manage workspaces

DA-100 Microsoft
2 nội dung chính của Deploy and Maintain Deliverables

  • Manage datasets 

Chúng ta ôn tập các kiến thức liên quan đến quản lý dataset. Một số kiến thức chính như: Cách thiết lập lịch trình resfresh cho dashboard trên service. Cách cấu hình row-level security trong trường hợp chúng ta muốn phân quyền dữ liệu/báo cáo hiển thị cho từng nhóm user khác nhau. Các thiết lập tùy chọn incremental refresh giúp quá trình refresh nhanh hơn…

  • Create and manage workspaces 

Một số kiến thức cần ôn tập liên quan đến phần tạo và quản lý workspaces trên Power BI service như: cách tạo và cấu hình một workspace, assign workspace roles, cách cấu hình và cập nhật một workspace app, … 

Tham gia group ôn thi DA-100 tại: https://www.facebook.com/groups/da100vn
Chuỗi Video Hướng dẫn thực hành Lab và sử dụng các tài nguyên của Microsoft: https://www.youtube.com/c/Datapotvn/videos
Update tài nguyên từ Microsoft, DA-100 exam questions và exam topics tại Fanpage của Datapot: https://www.facebook.com/DatapotAnalytics/
Chi tiết tham khảo: https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu
https://ravikirans.com/da-100-power-platform-exam-study-guide/

Khóa học Ôn thi DA-100
Combo khóa học dành cho các bạn Fresher
Posted on Leave a comment

Chuyện nghề Data #001

Một bài Post trên group Data Analytics and Business Intelligence Vietnam

Khi mới bước chân vào ngành dữ liệu, chúng ta thường không khỏi hoang mang, một là vì thiếu thông tin, chưa hiểu rõ về ngành, hai là vì có quá nhiều luồng thông tin, không biết nên tin bên nào.

Thấu hiểu sự băn khoăn này, Datapot cùng các bạn tháo gỡ mốt số lầm tưởng, thắc mắc khi bước vào ngành dữ liệu nhé!

Chia sẻ một chút về tác giả bài viết.

Context: Mình làm nhiều role trong cả vòng đời dữ liệu: Data Clerk, Data Analyst/BI, DBA, Solution Architect, Department Manager (Data Managment and Analytics), Consultant, Trainer…(Mình không nhảy việc nhiều, thay đổi theo quá trình phát triển công việc)

Mình note lại một số quan điểm của mình (mình đã từng lầm tưởng hoặc đang phổ biến):

1. Làm dữ liệu phải giỏi siêu nhân về toán, thần thánh về lập trình hoặc công cụ, hiểu rất sâu về business?

Sự thật là: Bạn code tốt hơn một ông thuần về business, hiểu về business hơn một ông dev bình thường, hiểu về toán tốt hơn cả 2 ông kia (cũng chưa biết đâu vì nhiều dev sịn mình biết học sư phạm toán với toán ứng dụng ra đấy :-s ). bạn viết truy vấn SQL có thể tốt hơn Dev vì bạn hiểu về business nhưng thử viết một stored produce xử lý một tác vụ của phần mềm xem có toang không đã nhé.

2. Bạn không cần học SQL, lập trình? Mấy cái đó chỉ dành cho các công ty nghèo không có tiền mua tool xịn như Power BI, Alteryx…. Còn làm gì có tool làm được hết rồi, cần thì request IT xử lý.

Sự thật là: Tool toy rất tiện và bản thân mình cũng ủng hộ tool nếu có thể. Tuy nhiên tool nào cũng có mặt hạn chế. Thử vào một doanh nghiệp và cần trích xuất dữ liệu trực tiếp với lượng dữ liệu từ vừa đến lớn với logic phức tạp thì SQL sẽ là cứu cánh để bạn triển khai được nhanh, gọn và mạch lạc hơn. Và mình học và làm việc sâu với SQL không phải vì mình “nghèo” mà vì tính phổ biến, khả năng tùy biến của ngôn ngữ và ưu điểm tuyệt đối của nó trong một số hoàn cảnh cụ thể. Ít nhất mình có quyền lựa chọn thay vì chết vì phụ thuộc tool toy.

3. Mình chỉ cần học về tư duy là đủ rồi, chứ công cụ không quan trọng?

Sự thật là:Việc đầu tiên khi người ta học làm bếp là học cầm con dao sơ chế miếng thịt, cá như thế nào. Với một chief có thể nấu được bữa ăn từ bất cứ những công cụ gì họ có trong tay. Họ làm được vì họ từng sử dụng qua rất nhiều công cụ chứ không phải họ chỉ ngồi học lý thuyết về ẩm thực. Trước đây mình đã từng viết 1 bài về Law of the Instrument: “if all you have is a hammer, everything looks like a nail”. Quá trình sử dụng công cụ để giải quyết vấn đề giúp bạn phát triển tư duy, nếu khả năng sử dụng công cụ của bạn bị giới hạn thì rất có thể bạn sẽ dẫn về số 2, phụ thuộc vào một công cụ nào đó vì không còn quyền lựa chọn. Khá hài hước khi tư tưởng coi thường công cụ nhưng xét mặt nào đó lại bị phụ thuộc vào công cụ. :))

4. Ngược lại với 3, mình cần phải giỏi công cụ X, master công cụ Y, công ty không tuyển mình vì mình không giỏi công cụ xyz.

Sự thật là:
 Thành thạo công cụ là một điểm cộng lớn khi bạn apply công việc, nhất là với các vị trí junior. Tuy nhiên, nếu như bạn đã thành thạo và tạo được sản phẩm bằng một công cụ nào đó, bạn hoàn toàn có thể học công cụ tương đương mà không mất nhiều thời gian. Các nguyên lý và cách sử dụng công cụ, ngôn ngữ lập trình đều tương tự nhau, nếu học hãy tập trung vào một số mảng và thực sự thành thạo nó thay vì đẽo cày giữa đường để gom key word ném vào CV.

5. Mình đã luyện xong 1001 đường tịch tà kiếm phổ, sẵn sàng trở thành siêu nhân trong ngành dữ liệu?

Sự thật là: Bạn có thể chỉ cần thuần Excel vẫn kiếm được công việc chính thức trong ngành dữ liệu với mức lương tính bằng nghìn USD (người thật việc thật). Nhưng đa phần các công việc trong ngành dữ liệu đều cần tìm hiểu thêm rất nhiều thứ khác, tech stack khác với dự án trước đây, domain khác với domain đã biết, nghiệp vụ hoặc luật lá thay đổi. Bạn sẽ tìm hiểu đủ thứ từ marketing đến UI-UX design, human heuristics…. Giữ tư duy mở và thái độ sẵn sàng học bất cứ cái gì công việc yêu cầu. Khả năng học và vận dụng nhanh mới giúp bạn sống sót và phát triển tốt trong ngành này.

6. Làm BI/DA là phải làm dashboard đẹp, kể được câu chuyện về dữ liệu, phải có 1001 nghiêm quy giới luật về information design cần tuân thủ?

Sự thật là: Bạn cần phải làm được những điều trên nhưng chỉ là một phần rất nhỏ trong công việc, nếu bạn tôn thờ nó quá thì nhiều khả năng bạn làm consultant hơn là làm in-house cho doanh nghiệp. Đào bới được dữ liệu xem nó nằm đâu trong hệ thống, thống nhất được với các đơn vị xem dữ liệu nào chính xác đã hộc máu rồi. Nhiều stakeholders chỉ cần một cái pivot table hay chart đơn giản là quá đủ cho nhu cầu của họ. Quan trọng là context và mục đích sử dụng và làm sao tối đa được giá trị cho stakeholders.

Tham khảo bài viết: 5 Lưu ý để trực quan hóa dữ liệu hiệu quả.

Tạm thế đã, các bạn ủng hộ đi rồi mình viết tiếp. :))

Posted on Leave a comment

10 Nội dung về SQL bạn nên biết khi tham gia phỏng vấn trong ngành dữ liệu (Phần 2)

SQL ngày càng quan trọng trong doanh nghiệp với rất nhiều ứng dụng. Tuy nhiên, với các buổi phỏng vấn trong ngành dữ liệu, sẽ có một số nội dung quan trọng mà hầu hết các công ty đều kiểm tra. Dưới đây là 10 nội dung xuất hiện nhiều nhất vì có tính ứng dụng cao trong thực tế công việc.

Đây cũng là những nội dung bạn nên ôn tập để chuẩn bị cho buổi phỏng vấn sắp tới. (Xem phần 1 tại đây)

6. Subqueries

Subquery, hay inner query, là truy vấn nằm trong 1 truy vấn khác với mệnh đề WHERE. Subquery có thể ứng dụng theo nhiều cách khác nhau để giải quyết những vấn đề phức tạp.

Câu hỏi ví dụ: Suppose that a website contains two tables, the Customers table and the Orders table. Write a SQL query to find all customers who never order anything.

7. String Formatting

Các hàm về chuỗi ký tự rất quan trọng khi làm việc với dữ liệu chưa được làm sạch. Chính vì vậy, nhiều công ty sẽ có bài test liên quan đến dữ liệu chuỗi ký tự để đảm bảo bạn có thể xử lý dữ liệu hiệu quả.

Các nội dung cơ bản về chuỗi ký tự:

LEFT, RIGHT

TRIM

POSITION

SUBSTR

CONCAT

UPPER, LOWER

COALESCE

Follow Fanpage Datapot từ để cập nhật những nội dung liên quan như ảnh dưới đây nhé.

8. Date-time Manipulation

Một nội dung phổ biến trong các bài test tuyển dụng chính là các câu hỏi liên quan đến dữ liệu date-time. Bạn có thể được yêu cầu nhóm các dữ liệu theo tháng hoặc chuyển định dạng từ DD-MM-YYYY sang chỉ hiển thị tháng.

2 hàm bạn cần chú ý là:

EXTRACT

DATEDIFF

Câu hỏi ví dụ: Given a Weather table, write a SQL query to find all dates’ Ids with higher temperature compared to its previous (yesterday’s) dates.

9. Window functions 

Window functions cho phép bạn tính các giá trị gộp (sum, max, count,…) của tất cả các hàng, thay vì  một hàng (như khi sử dụng Group by). Window functions rất hữu ích trong việc xếp hạng, tính lũy kế,…

Câu hỏi ví dụ: Write a query to get the empno with the highest salary. Make sure your solution can handle ties!

10. UNION

Cuối cùng chính là UNION. Tuy không quá phổ biến như các nội dung trên, tuy nhiên bạn cũng có khả năng gặp câu hỏi về UNION và chuẩn bị không bao giờ là thừa. Nếu bạn muốn gộp 2 bảng có 1 số cột giống nhau, đây là lúc sử dụng UNION (Google thêm để tìm hiểu chi tiết về UNION nhé).

Nguồn tham khảo: Towardsdatascience.com

Bên cạnh chỉ học thuộc các câu lệnh, việc hiểu rõ logic đằng sau mỗi câu lệnh, và cách áp dụng chúng trong những trường hợp cụ thể là rất quan trọng. Đây chính là sự khác biệt giữa một người biết SQL và một người có thể sử dụng SQL trong công việc.

Với đội ngũ giảng viên được đào tạo bài bản, nhiều năm kinh nghiệm phân tích và xử lý dữ liệu ở cả môi trường doanh nghiệp trong và ngoài nước, Datapot hướng tới mục tiêu cung cấp những khóa học đơn giản, hiệu quả và gắn liền với thực tiễn nhất có thể.

Tham khảo khóa học SQL for Data Analytics khai giảng 23/11.

Posted on Leave a comment

Bắt đầu học Python như thế nào để ứng dụng trong phân tích dữ liệu?

Là ngôn ngữ lập trình phổ biến nhất trên thế giới, Python thường được giới thiệu đầu tiên cho các bạn muốn theo ngành dữ liệu. Với một rừng tư liệu miễn phí, đầu tư thời gian và nỗ lực học Python có thật sự là lựa chọn lý tưởng?

Bạn có nên học Python hay không? Nên học những gì? Lộ trình như thế nào để phục vụ cho việc theo đuổi ngành dữ liệu? Để trả lời những câu hỏi trên, hãy tham khảo bài viết này nhé!

Ứng dụng của Python trong lĩnh vực Data Science như thế nào?

Ví dụ flow làm việc với Python của một Data Scientist

  1. Sử dụng Python và SQL để truy vấn dữ liệu từ cơ sở dữ liệu của doanh nghiệp.
  2. Sử dụng thư viện pandas của Python để làm sạch dữ liệu, sắp xếp vào các bảng để sẵn sàng cho việc phân tích.
  3. Với các thư viện pandas và matplotlib, chúng ta bắt đầu phân tích, khám phá và visualize.
  4. Sử dụng thư viện scikit-learn để xây dựng các model dự đoán từ dữ liệu sẵn có.
  5. Sắp xếp kết quả phân tích và dự đoán thành với format phù hợp để chia sẻ với các thành viên trong công ty.

Vậy có phải cứ muốn theo đuổi ngành dữ liệu là nên học Python đầu tiên?

Nếu các bạn định hướng trở thành Data Scientist, bạn có thể lựa chọn giữa Python và R. Nhình chung thì Python đang là ngôn ngữ phổ biến hơn (R thường phổ biến trong học thuật và nghiên cứu).

Tuy nhiên, với các bạn định hướng trở thành Data Analyst, BI Analyst, thì như các bạn có thể tìm hiểu trên các tin tuyển dụng, Python sẽ là 1 điểm cộng, chứ không hẳn là công cụ bắt buộc. Nên tùy vào nhu cầu công việc, các bạn có thể lựa chọn học Python hay không.

Học Python như thế nào?

Bước 1: Học các nội dung căn bản về lập trình với Python

Nếu bạn chưa biết code, hoặc chưa sử dụng python bao giờ, bạn sẽ cần bắt đầu từ những khái niệm căn bản nhất như biến, vòng lặp, các câu lệnh cơ bản, logic trong ngôn ngữ lập trình và cách kết hợp chúng như thế nào để thực hiện được 1 tác vụ, giải một bài toán nào đó.

Bước 2: Học về Ứng dụng Python trong phân tích dữ liệu

Các ứng dụng có thể chia làm 4 nhóm chính

  1. Data collecting: Thu thập dữ liệu từ các nguồn khác nhau như file Excel, Database, crawl website,…
  2. Data manipulation: Phần lớn các dữ liệu trong thực tế đều cần xử lý, biến đổi trước khi đưa vào phân tích, nên đây sẽ là kỹ năng bạn cần thành thạo.
  3. Data visualization: Đây sẽ là thử thách cả về lập trình lẫn trình bày, thiết kế (tuy nhiên bạn cũng có thể sử dụng các tool khác chuyên về visualization để hỗ trợ).
  4. Machine Learning: Cần có các kiến thức về thống kê cũng như kinh nghiệm trong lĩnh vực cụ thể để ứng dụng.  

Các thư viện bạn có thể tìm hiểu: NumPy, pandas, Matplotlib, scikit-learn,…

Bước 3: Thực hành với các dự án thực tế

Bạn có thể thấy rằng từ tìm hiểu về tất cả các nội dung trên cho đến có thể thực hành thành thạo và ứng dụng trong công việc không phải là một con đường dễ dàng. Chính vì vậy, các bạn cần xác định rõ mục tiêu, nhu cầu của bản thân và lựa chọn lộ trình học phù hợp để có thể sử dụng Python hiệu quả nhất và không lãng phí thời gian của bản thân.

Với nhiều năm kinh nghiệm làm việc và đào tạo trong ngành dữ liệu, đội ngũ Datapot thiết kế khóa học Python for Data Analytics, tập trung vào ứng dụng Python cơ bản và thiết thực trong phân tích dữ liệu. 

Nguồn tham khảo: Dataquest

Posted on Leave a comment

10 Nội dung về SQL bạn nên biết khi tham gia phỏng vấn trong ngành dữ liệu (Phần 1)

SQL ngày càng quan trọng trong doanh nghiệp với rất nhiều ứng dụng. Tuy nhiên, với các buổi phỏng vấn trong ngành dữ liệu, sẽ có một số nội dung quan trọng mà hầu hết các công ty đều kiểm tra. Dưới đây là 10 nội dung xuất hiện nhiều nhất vì có tính ứng dụng cao trong thực tế công việc.

Đây cũng là những nội dung bạn nên ôn tập để chuẩn bị cho buổi phỏng vấn sắp tới.

1. Case when

Bạn sẽ gặp nhiều câu hỏi yêu cầu sử dụng Case when, đơn giản vì sự đa dạng trong ứng dụng. Case when cho phép bạn viết các câu lệnh điều kiện phức tạp, xác định những giá trị hoặc nhóm nhất định phụ thuộc vào các biến khác.

Bên cạnh đó, Case when còn giúp bạn tạo pivot table.

Một câu hỏi VD: Write an SQL query to reformat the table so that there is a revenue column for each month.

2. Select distinct

Select distinct là một nội dung bạn cần nắm rõ, rất phổ biến khi kết hợp với aggregate functions.

VD: Nếu bạn có bảng về Customer orders (đơn hàng), bạn thường được yêu cầu tính số đơn hàng trung bình mỗi khách hàng mua. Trong trường hợp này, bạn sẽ tính Tổng số đơn hàng/ Tổng số khách hàng, như dưới đây:

3. Aggregate Functions

Liên quan đến ý bên trên, bạn cần nắm rõ các Aggregate Functions như min, max, sum, count,… Điều này cũng có nghĩa là bạn cần hiểu rõ về cách sử dụng GROUP BY và HAVING. Ở phần này, bạn nên dành nhiều thời gian thực hành, vì với cùng 1 câu hỏi có thể có nhiều cách khác nhau để sử dụng aggregate functions.

VD: Write a SQL query to find all duplicate emails in a table named Person.

4. Left Joins và Inner Joins

Với các bạn mới học SQL, Left Joins và Inner Joins thường dễ gây nhầm lẫn. Bạn cần hiểu rõ với từng phép join sẽ trả về kết quả khác nhau như thế nào. Trong các câu hỏi phỏng vấn, bạn sẽ được yêu cầu thực hành nội dung này, và biết nên sử dụng loại join nào chính là điều quan trọng nhất để trả lời đúng.

5. Self-joins

Chúng ta sẽ đến với một nội dung thú vị – self-join. Việc này phổ biến hơn bạn tưởng bởi vì trong thực tế, khi dữ liệu được lưu trong những bảng lớn thay vì nhiều bảng nhỏ, self-join được sử dụng để giải quyết một số vấn đề đặc biệt như ví dụ dưới đây.

Example Question: Given the Employee table below, write a SQL query that finds out employees who earn more than their managers. For the above table, Joe is the only employee who earns more than his manager.

Nguồn tham khảo: Towardsdatascience.com

Bên cạnh chỉ học thuộc các câu lệnh, việc hiểu rõ logic đằng sau mỗi câu lệnh, và cách áp dụng chúng trong những trường hợp cụ thể là rất quan trọng. Đây chính là sự khác biệt giữa một người biết SQL và một người có thể sử dụng SQL trong công việc.

Với đội ngũ giảng viên được đào tạo bài bản, nhiều năm kinh nghiệm phân tích và xử lý dữ liệu ở cả môi trường doanh nghiệp trong và ngoài nước, Datapot hướng tới mục tiêu cung cấp những khóa học đơn giản, hiệu quả và gắn liền với thực tiễn nhất có thể.

Tham khảo khóa học SQL for Data Analytics khai giảng 21/9 với đầy đủ các nội dung nêu trên.

Posted on Leave a comment

Review Bài thi DA-100

Với một năm rưỡi kinh nghiệm làm việc với Power BI, hôm nay mình đã thi & pass bài thi DA-100.

Vì vậy trong bài viết này, mình sẽ chia sẻ kinh nghiệm thi của mình và 1 số lưu ý, mong là sẽ hữu ích cho các bạn chuẩn bị thi trong thời gian tới.

Lưu ý: Các nội dung thi sẽ thay đổi sau ngày 24/9/2020. Bạn có thể xem các nội dung thi & phân bổ ở link này.

https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu

Tài liệu ôn thi

Mình không tham gia khóa học nào, thi hoàn toàn dựa trên kinh nghiệm làm việc với Power BI tại công ty. Ngoài ra, bạn có thể tham khảo lộ trình ôn thi chính thức của Microsoft tại đây.

https://docs.microsoft.com/en-us/learn/certifications/exams/da-100

Thời gian thi: 210 phút, thoải mái để hoàn thành bài thi

Cấu trúc bài thi: Có tất cả 56 câu hỏi trắc nghiệm, trong đó 8 câu hỏi cuối liên quan đến case study.

Review và một số lưu ý: Dưới đây là phân bổ điểm của mình để các bạn biết mình làm ok và không ok ở những phần nào. Mình sẽ tóm tắt lại về một số nội dung mà các bạn sẽ gặp trong bài thi cũng như lưu ý về các nội dung đó để các bạn có thể ôn tập.

Prepare the Data

Ở công ty mình thường chỉ kết nối dữ liệu từ SQL databases. Vì vậy, tuning functions hay data aggregations đều khá lạ lẫm. Nếu bạn cũng làm việc trong các công ty nhỏ như mình, thì bạn có thể ôn tập về các từ khóa như ‘Query Diagnostics’, ‘Query Parameters’ và ‘Data Aggregations’. “Data Profilling” cũng là một topic bạn cần tìm hiểu.

Model the Data

Data Modelling và Dax đều nằm trong chủ đề này. Các bạn sẽ được thử thách với câu hỏi về Changing the “filter context of a measure” using CALCULATE. Bạn nên ôn tập về Time Intelligence Functions và M code (ở mức cơ bản, mình đã luyện phần này khi thi bài thi 70 – 778 – analyzing and visualizing with Power BI). Về phần Data Model, các bạn cần hiểu kỹ về topic “Cardinality and Relationship”.

Visualize the data

Mình không có lưu ý gì về phần này. Các bạn có thể mò thêm với “analytics pane” của line chart. Mặc dù mình nghĩ là mình đã trả lời đúng hết các câu hỏi phần này nhưng kết quả thì không phải vậy.

Analyze the Data

Đây là phần mình làm tốt nhất. Sử dụng ‘Q/A Visuals’ và ‘Quick Insights’ là 2 tính năng bạn cần để ý.

Deploy and Maintain Deliverables

Với vai trò là Power BI admin, bạn sẽ được kiểm tra về việc phân quyền trong môi trường làm việc với những yêu cầu bảo mật khác nhau. Nên bạn cần ôn nội dung về “Row-Level Security” với cả Power BI Desktop và Service. 2 chức năng khác mà bạn cần chú ý là “Data Refreshes” và “Data Gateways”.

Kết luận

Trong bài test không có các nội dung về tính năng của Power BI Premium, nhưng bạn có thể xem qua về các khác biệt cơ bản giữa Power BI Pro và Power BI Premium. Nếu bạn đã có trên 1 năm sử dụng Power BI, thì khả năng cao là bạn sẽ pass DA-100, tuy nhiên để đạt điểm cao thì bạn nên xem Lộ trình học từ Microsoft và ôn tập thêm.

Khi Exam 70-778 hết hạn vào năm 2021, thì đây là điểm thích hợp để bạn cập nhật những tính năng mới về Power BI, pass DA-100 và sở hữu chứng chỉ Data Analyst Associate từ Microsoft.

Tham gia group ôn thi DA-100 tại https://www.facebook.com/groups/da100vn

Nguồn: https://controlflow.blog/da100-review/

Posted on Leave a comment

Về các chứng chỉ Microsoft trong lĩnh vực dữ liệu.

Exam DA-100 mình thi thử từ lúc mới bắt đầu Beta từ tháng 4 cũng đã go-live chính thức và trả kết quả. Cũng nhiều bạn inbox hỏi về bài test này nên mình viết bài này để tổng hợp một số bài thi + chứng chỉ phù hợp với các bạn mới bắt đầu và nghiêm túc theo đuổi mảng dữ liệu.

Có kết quả lúc nào cũng chẳng biết :))

Tại sao phải thi chứng chỉ?

Trong thời buổi người người học Data, nhà nhà học Data với ma trận các loại công cụ và kỹ năng khiến cho người học khó xác định mục tiêu cụ thể, nhà tuyển dụng khó xác định được trình độ ứng viên. Việc học và thi một chứng chỉ sẽ giúp các bạn củng cố và hoàn thiện một tập hợp kỹ năng cụ thể, được công nhận bởi Microsoft và được đánh giá chính xác hơn từ doanh nghiệp, nhà tuyển dụng. Vừa xác định chính xác mục tiêu học tập vừa được công nhận từ Microsoft, quá ổn.

Về hệ thống chứng chỉ của Microsoft

Các chứng chỉ của Microsoft xác nhận khả năng sử dụng một công nghệ (tech-based certificate ) hoặc khả năng đảm nhiệm một vị trí công việc cụ thể (role-based certificate) sử dụng chủ yếu các công nghệ của Microsoft.

Xem thêm tại: https://docs.microsoft.com/en-us/learn/certifications/browse/

Để đạt được một chứng chỉ (certificate) bạn cần pass qua một số bài thi (exam) theo yêu cầu, có thể cần một chứng chỉ là điều kiện tiên quyết cho chứng chỉ còn lại. VD: Microsoft Certified Solution Expert (MCSE) thường yêu cầu học viên phải có Microsoft Certified Solution Associate (MCSA) và pass qua các bài test quy định.

Các bài thi (exam) không cần đúng thứ tự, chỉ cần bạn pass qua đủ các bài thi yêu cầu, chứng chỉ tương ứng sẽ tự động được thêm vào profile của bạn. Một bài thi có thể được dùng cho nhiều chứng chỉ khác nhau.

Chi phí và cách thức thi

Chi phí: Các bài thi của Microsoft có giá tại US và $160/exam, nếu chuyển location về Việt Nam, chi phí chỉ còn $80/Exam. Mức giá hợp lý so với chi phí thi các chứng chỉ khác. ( Tableau lên đến $600 :-s )

Hình thức thi: Microsoft ủy quyền việc tổ chức thi cho Pearson Vue. Bạn có thể đến các trung tâm khảo thí được ủy quyền của Pearson Vue hoặc đăng ký thi online. Mình thường thi online vì chủ động thời gian và không phải đi lại. Tuy là thi online nhưng bạn vẫn “được” giám sát thông qua camera và micro nên đừng nghĩ đến chuyện cheating gì cả nhé. :)) Mình có cậu em bị hủy kết quả thi chỉ do có bóng người đi ngang qua lúc đang thi :RIP: Chi tiết quá trình đăng ký và cách thức thi, những lưu ý để không bị bay màu mình sẽ có một bài riêng sau.

Bài thi 100% trắc nghiệm, điểm pass của các bài thi là 700/1000, cơ chế phân phối và cách chấm điểm khác nhau nên không phải cứ làm đúng 70% số câu hỏi là pass, các bạn lưu ý. Hình thức và câu hỏi mẫu mình sẽ làm 1 bài review chi tiết trong group kín (Microsoft cấm các trao đổi về nội dung bài thi).

Thời gian mỗi exam là 180 phút cho ~50 câu hỏi (tùy bài test). Khá dài, như 4 bài mình từng thi thì chỉ dùng hết 60-90 phút. Các bạn không được ăn uống, đi lại hay rời khỏi máy tính trong thời gian này nếu không sẽ bị loại.

Ngôn ngữ thi: Tiếng Anh (Có một số tùy chọn ngôn ngữ khác, nhưng không có tiếng Việt). Bạn cũng sẽ giao tiếp với proctor bằng tiếng Anh, giao tiếp cơ bản thôi nên bạn không phải lo.

Các chứng chỉ: MCSA, MCSE và Microsoft Certified: Data Analyst Associate

Hệ thống chứng chỉ của Microsoft nhiều như quân nguyên, trước đây mình có viết một bài cập nhật những thay đổi gần đây trong hệ thống chứng chỉ. Các bạn có thể xem tại đây: Link

Các bạn có thể xem các chứng chỉ và bài thi của Microsoft tại: Link

Trong phạm vi bài viết này mình sẽ nói về 3 chứng chỉ trong career path Data Management and Analytics. Phù hợp với các bạn định hướng làm Business Intelligent, Data Analyst

Data Management & Analytics Path

Trong hệ thống chứng chỉ hiện tại, MCSE – Microsoft Certified Solution Expert được Microsoft đánh giá tương đương 05 năm kinh nghiệm làm việc chuyên sâu trong lĩnh vực và công nghệ tương ứng. MCSA – Microsoft Certified Solution Associate được đánh đánh giá tương đương 02 năm kinh nghiệm. Để đạt được MCSE, các bạn cần đạt được ít nhất 01 trong 05 chứng chỉ MCSA và pass ít nhất 01 elective exam trong danh sách.

Dễ thấy với các bạn làm thiên về BI và phân tích dữ liệu sẽ phù hợp nhất với MCSA: BI Reporting. Để đạt được chứng chỉ này các bạn cần vượt qua 2 bài test 70-778: Analyzing and Visualizing Data with Microsoft Power BI và 70-779: Analyzing and Visualizing Data with Microsoft Excel.

Mình thi thử thấy 70-778 và 70-779 giống nhau đến 80%. Chỉ khác nhau công cụ sử dụng là Power BI và Excel (Power Pivot + Power Query). Phía bài thi Power BI có khó hơn một chút do có các câu hỏi liên quan đến Power BI Service. Có thể nói nếu bạn tự tin với 70-778 thì bạn hoàn toàn có thể pass 70-779, bài thi 70-779 là không cần thiết(phí 80 trump tệ ;))). Đây có lẽ cũng là lý do khi Micosoft quyết định chuyển đổi sang chứng chỉ Microsoft Certified: Data Analyst với chỉ một bài thi duy nhất xoay quanh Power BI.

Với các bạn đang ôn hoặc chuẩn bị thi MCSA: BI Reporting, việc chuyển đổi sang Microsoft Certified: Data Analyst có một số lợi thế như sau:

Giản lược về cấu trúc: MCSA: BI Reporting gồm 2 bài thi 70-778 (Power BI) và 70-779 (Excel Power Pivot), Microsoft Certified: Data Analyst Associate chỉ có một bài thi duy nhất DA-100 (Power BI).

Nâng cấp về nội dung: So với 70-778, DA-100 bổ sung them các topic về Analyze the data (10-15%) và Deploy and maintain deliverables (10-15%). Việc giảm cấu phần các vấn đề technical và tăng cấu phần các hoạt động liên quan trực tiếp đến hiệu quả công việc Analyze, Deploy & Maintain Deliverables cho thấy Microsoft đã update các yêu cầu chứng chỉ để gần hơn với nhu cầu công việc thực tế.

Bài thi mới và cung cấp dài hạn hơn so với MCSA sẽ ngừng cung cấp vào tháng 01-2021. (chứng chỉ đã nhận được vẫn còn hiệu lực)

Có thể nói, DA-100: Analyzing Data with Microsoft Power BI là một sự lựa chọn hợp lý và tối ưu hơn nhiều so với hai exam 70-778 và 70-779.

Thông tin về DA-100 trên trang chủ Microsoft: Link

Bài viết tiếp theo mình sẽ review kỹ hơn về nội dung 4 exam mình đã làm qua. Sẽ có tài liệu và road map cho các bạn muốn theo đuổi mảng này.

  1. 70-778: Analyzing and Visualizing Data with Microsoft Power BI
  2. 70-779: Analyzing and Visualizing Data with Microsoft Excel
  3. 70-768: Developing SQL Data Models
  4. DA-100: Analyzing Data with Microsoft Power BI
Sưu tập món này vui phết.

Theo dõi các bài viết tiếp theo, trao đổi kinh nghiệm & tài liệu luyện chi chứng chỉ của Microsoft cho Data Analyst tại group Microsoft Certified: Data Analyst Associate Việt Nam (DA-100)

Posted on Leave a comment

Kỹ năng nào là cần thiết với một BA mới vào nghề?

Nếu bạn đang tìm hiểu về vị trí Business Analyst và thắc mắc bạn cần chuẩn bị những kỹ năng và kinh nghiệm gì thì bài viết này dành cho bạn.

Các nhóm kỹ năng cần thiết đối với một BA mới vào nghề phải kể đến: 

  1. Nhóm kỹ năng nền tảng
  2. Nhóm kỹ năng chuyên môn
  3. Nhóm kỹ năng mềm.

1. NHÓM KỸ NĂNG NỀN TẢNG

Kỹ năng giao tiếp

BA phải là một người giỏi giao tiếp. Họ có thể tổ chức thành công các buổi họp không chỉ gặp mặt trực tiếp mà ngay cả các buổi họp trực tuyến, biết lắng nghe và tiếp nhận các ý kiến cũng như biết cách đặt vấn đề để khai thác tối đa các nguồn thông tin trong buổi họp.

Kỹ năng giải quyết vấn đề

Không một dự án nào là không có vấn đề. Trên thực tế, toàn bộ dự án đã chính là một giải pháp cho một vấn đề. BA được xem như là người tạo điều kiện giúp mọi người nắm được thông tin chung về vấn đề, các giải pháp khả thi và xác định phạm vi của dự án. BA cũng là người hỗ trợ giải quyết các thách thức kỹ thuật, đặc biệt trong việc giải quyết các vấn đề phát sinh giữa bên kinh doanh và kỹ thuật.

Kỹ năng tư duy phản biện

BA là người chịu trách nhiệm đánh giá các lựa chọn trước khi cùng team giải quyết một vấn đề. Khi xác định được vấn đề cần giải quyết, BA cần lắng nghe nhu cầu của các bên liên quan đồng thời phải xem xét các nhu cầu đó và đặt câu hỏi thăm dò để hiểu rõ và nắm được nhu cầu thực sự. Đây cũng chính là lý do tư duy phản biện trở nên quan trọng với các BA.

2. NHÓM KỸ NĂNG CHUYÊN MÔN

Kỹ năng kết nối và chuẩn hóa tài liệu

Các kỹ thuật liên kết giúp BA nắm rõ và hiểu chính xác nhu cầu thực sự của các bên liên quan trong quá trình khám phá thông tin. Glossary và User Stories được coi là một trong các kỹ thuật để nắm bắt và truyền đạt thông tin liên quan đến yêu cầu với các bên liên quan.

BA cũng cần phải quản lý và lưu trữ được các tài liệu về dự án. Các yêu cầu, nội dung các cuộc họp, trao đổi, các tài liệu xoay quanh dự án đều cần được sắp xếp và tổ chức khoa học.

Kỹ năng phân tích

BA sử dụng rất nhiều kĩ thuật để phân tích vấn đề và giải pháp. Khi mới vào nghề, bạn sẽ phân tích vấn đề một cách tự nhiên. Nhưng khi có nhiều kinh nghiệm hơn bạn sẽ biết cách sử dụng các kĩ thuật để tiến hành phân tích và mổ xẻ vấn đề một cách hiệu quả hơn.

Với mỗi trường hợp, BA sẽ áp dụng các kĩ thuật phân tích phù hợp như:

–          Business-Level: BA sẽ áp dụng các a textual model visual model (flow diagram) để phân tích một quy trình kinh doanh.

–          Software-level: usercasewireframe được sử dụng để phân tích cách một phần mềm hỗ trợ quy trình kinh doanh.

–          Information-level: BA sử dụng data modeling techniques như Mô hình quan hệ thực thể (ERD), data dictionary, data map, and system context diagram để hiểu dữ liệu và thông tin được lưu trữ và duy trì như thế nào.


Các công cụ hỗ trợ việc phân tích

Ngoài việc thành thạo các ứng dụng văn phòng như: Word, Excel, PowerPoint, BA cần biết sử dụng một số công cụ khác: Công cụ để modeling như Visio hoặc Enterprise Architech; Công cụ để quản lý yêu cầu như DOORS hoặc Caliber; Công cụ để quản lý dự án như: Microsoft Project; Công cụ phân tích như: Power BI, Tablue,..

3. NHÓM KỸ NĂNG MỀM

Kỹ năng xây dựng quan hệ

Đầu tiên và quan trọng nhất trong danh sách các kỹ năng mềm là kỹ năng xây dựng quan hệ, thường được gọi là quan hệ giữa các bên liên quan. Bên liên quan là bất cứ ai có đóng góp cho dự án của bạn và thường bạn sẽ làm việc với nhiều bên liên quan từ doanh nghiệp đến đội kỹ thuật.

Kỹ năng này liên quan đến việc xây dựng niềm tin và BA có vai trò lãnh đạo nhóm dự án để thu hẹp khoảng cách giữa các bên.

Kỹ năng tự quản lý công việc

BA không phải là người quản lý dự án, tuy nhiên việc tự quản lý công việc là một kỹ năng quan trọng với một người BA thành công. Ngoài ra, BA cũng cần trang bị thêm các kỹ năng như: kỹ năng quản lý thời gian, kỹ năng đặt mục tiêu, kỹ năng quản lý rủi ro.

Kỹ năng “Thick Skin”

BA sẽ nhận được một loạt các phản hồi về tài liệu và các giải pháp đã được đề xuất. Để trở thành một BA thành công, bạn cần công tư phân minh, nghĩa là có khả năng tách biệt các phản hồi về tài liệu với các ý kiến về cá nhân bạn.

Kỹ năng đối mặt với “sự mơ hồ”

BA coi “sự mơ hồ” là kẻ thù không đội trời chung. Sự mơ hồ trong các yêu cầu kỹ thuật có thể dẫn đến những lỗ hổng không lường trước được. Sự mơ hồ trong cuộc trò chuyện có thể dẫn đến những xung đột không cần thiết. Ở mỗi giai đoạn của một dự án, nhiệm vụ của BA là làm rõ và giải quyết sự mơ hồ.

Tuy nhiên, khi bắt đầu một dự án, trước khi hiểu đầy đủ vấn đề và đưa ra giải pháp, một BA phải có khả năng nắm bắt sự mơ hồ và làm việc hiệu quả thông qua sự mơ hồ đó. Quản lý sự mơ hồ có nghĩa là nắm bắt được thông tin mới và tìm hiểu ngay khi nó xuất hiện.

Trên đây là những kỹ năng cần thiết nhất đối với một người mới bước chân vào nghề BA. Nếu bạn đang quan tâm đến nghề BA hoặc bạn đang làm việc với vai trò BA thì hãy trang bị cho mình các kỹ năng này ngày một nhuần nhuyễn nhé.

Nguồn: https://www.bridging-the-gap.com/business-analyst-skills-important/

https://home.datapot.vn/product/data-for-ba/