Posted on Leave a comment

10 Nội dung về SQL bạn nên biết khi tham gia phỏng vấn trong ngành dữ liệu (Phần 1)

SQL ngày càng quan trọng trong doanh nghiệp với rất nhiều ứng dụng. Tuy nhiên, với các buổi phỏng vấn trong ngành dữ liệu, sẽ có một số nội dung quan trọng mà hầu hết các công ty đều kiểm tra. Dưới đây là 10 nội dung xuất hiện nhiều nhất vì có tính ứng dụng cao trong thực tế công việc.

Đây cũng là những nội dung bạn nên ôn tập để chuẩn bị cho buổi phỏng vấn sắp tới.

1. Case when

Bạn sẽ gặp nhiều câu hỏi yêu cầu sử dụng Case when, đơn giản vì sự đa dạng trong ứng dụng. Case when cho phép bạn viết các câu lệnh điều kiện phức tạp, xác định những giá trị hoặc nhóm nhất định phụ thuộc vào các biến khác.

Bên cạnh đó, Case when còn giúp bạn tạo pivot table.

Một câu hỏi VD: Write an SQL query to reformat the table so that there is a revenue column for each month.

2. Select distinct

Select distinct là một nội dung bạn cần nắm rõ, rất phổ biến khi kết hợp với aggregate functions.

VD: Nếu bạn có bảng về Customer orders (đơn hàng), bạn thường được yêu cầu tính số đơn hàng trung bình mỗi khách hàng mua. Trong trường hợp này, bạn sẽ tính Tổng số đơn hàng/ Tổng số khách hàng, như dưới đây:

3. Aggregate Functions

Liên quan đến ý bên trên, bạn cần nắm rõ các Aggregate Functions như min, max, sum, count,… Điều này cũng có nghĩa là bạn cần hiểu rõ về cách sử dụng GROUP BY và HAVING. Ở phần này, bạn nên dành nhiều thời gian thực hành, vì với cùng 1 câu hỏi có thể có nhiều cách khác nhau để sử dụng aggregate functions.

VD: Write a SQL query to find all duplicate emails in a table named Person.

4. Left Joins và Inner Joins

Với các bạn mới học SQL, Left Joins và Inner Joins thường dễ gây nhầm lẫn. Bạn cần hiểu rõ với từng phép join sẽ trả về kết quả khác nhau như thế nào. Trong các câu hỏi phỏng vấn, bạn sẽ được yêu cầu thực hành nội dung này, và biết nên sử dụng loại join nào chính là điều quan trọng nhất để trả lời đúng.

5. Self-joins

Chúng ta sẽ đến với một nội dung thú vị – self-join. Việc này phổ biến hơn bạn tưởng bởi vì trong thực tế, khi dữ liệu được lưu trong những bảng lớn thay vì nhiều bảng nhỏ, self-join được sử dụng để giải quyết một số vấn đề đặc biệt như ví dụ dưới đây.

Example Question: Given the Employee table below, write a SQL query that finds out employees who earn more than their managers. For the above table, Joe is the only employee who earns more than his manager.

Nguồn tham khảo: Towardsdatascience.com

Bên cạnh chỉ học thuộc các câu lệnh, việc hiểu rõ logic đằng sau mỗi câu lệnh, và cách áp dụng chúng trong những trường hợp cụ thể là rất quan trọng. Đây chính là sự khác biệt giữa một người biết SQL và một người có thể sử dụng SQL trong công việc.

Với đội ngũ giảng viên được đào tạo bài bản, nhiều năm kinh nghiệm phân tích và xử lý dữ liệu ở cả môi trường doanh nghiệp trong và ngoài nước, Datapot hướng tới mục tiêu cung cấp những khóa học đơn giản, hiệu quả và gắn liền với thực tiễn nhất có thể.

Tham khảo khóa học SQL for Data Analytics khai giảng 21/9 với đầy đủ các nội dung nêu trên.

Posted on Leave a comment

Review Bài thi DA-100

Với một năm rưỡi kinh nghiệm làm việc với Power BI, hôm nay mình đã thi & pass bài thi DA-100.

Vì vậy trong bài viết này, mình sẽ chia sẻ kinh nghiệm thi của mình và 1 số lưu ý, mong là sẽ hữu ích cho các bạn chuẩn bị thi trong thời gian tới.

Lưu ý: Các nội dung thi sẽ thay đổi sau ngày 24/9/2020. Bạn có thể xem các nội dung thi & phân bổ ở link này.

https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE4qlRu

Tài liệu ôn thi

Mình không tham gia khóa học nào, thi hoàn toàn dựa trên kinh nghiệm làm việc với Power BI tại công ty. Ngoài ra, bạn có thể tham khảo lộ trình ôn thi chính thức của Microsoft tại đây.

https://docs.microsoft.com/en-us/learn/certifications/exams/da-100

Thời gian thi: 210 phút, thoải mái để hoàn thành bài thi

Cấu trúc bài thi: Có tất cả 56 câu hỏi trắc nghiệm, trong đó 8 câu hỏi cuối liên quan đến case study.

Review và một số lưu ý: Dưới đây là phân bổ điểm của mình để các bạn biết mình làm ok và không ok ở những phần nào. Mình sẽ tóm tắt lại về một số nội dung mà các bạn sẽ gặp trong bài thi cũng như lưu ý về các nội dung đó để các bạn có thể ôn tập.

Prepare the Data

Ở công ty mình thường chỉ kết nối dữ liệu từ SQL databases. Vì vậy, tuning functions hay data aggregations đều khá lạ lẫm. Nếu bạn cũng làm việc trong các công ty nhỏ như mình, thì bạn có thể ôn tập về các từ khóa như ‘Query Diagnostics’, ‘Query Parameters’ và ‘Data Aggregations’. “Data Profilling” cũng là một topic bạn cần tìm hiểu.

Model the Data

Data Modelling và Dax đều nằm trong chủ đề này. Các bạn sẽ được thử thách với câu hỏi về Changing the “filter context of a measure” using CALCULATE. Bạn nên ôn tập về Time Intelligence Functions và M code (ở mức cơ bản, mình đã luyện phần này khi thi bài thi 70 – 778 – analyzing and visualizing with Power BI). Về phần Data Model, các bạn cần hiểu kỹ về topic “Cardinality and Relationship”.

Visualize the data

Mình không có lưu ý gì về phần này. Các bạn có thể mò thêm với “analytics pane” của line chart. Mặc dù mình nghĩ là mình đã trả lời đúng hết các câu hỏi phần này nhưng kết quả thì không phải vậy.

Analyze the Data

Đây là phần mình làm tốt nhất. Sử dụng ‘Q/A Visuals’ và ‘Quick Insights’ là 2 tính năng bạn cần để ý.

Deploy and Maintain Deliverables

Với vai trò là Power BI admin, bạn sẽ được kiểm tra về việc phân quyền trong môi trường làm việc với những yêu cầu bảo mật khác nhau. Nên bạn cần ôn nội dung về “Row-Level Security” với cả Power BI Desktop và Service. 2 chức năng khác mà bạn cần chú ý là “Data Refreshes” và “Data Gateways”.

Kết luận

Trong bài test không có các nội dung về tính năng của Power BI Premium, nhưng bạn có thể xem qua về các khác biệt cơ bản giữa Power BI Pro và Power BI Premium. Nếu bạn đã có trên 1 năm sử dụng Power BI, thì khả năng cao là bạn sẽ pass DA-100, tuy nhiên để đạt điểm cao thì bạn nên xem Lộ trình học từ Microsoft và ôn tập thêm.

Khi Exam 70-778 hết hạn vào năm 2021, thì đây là điểm thích hợp để bạn cập nhật những tính năng mới về Power BI, pass DA-100 và sở hữu chứng chỉ Data Analyst Associate từ Microsoft.

Tham gia group ôn thi DA-100 tại https://www.facebook.com/groups/da100vn

Nguồn: https://controlflow.blog/da100-review/