Posted on Leave a comment

10 Nội dung về SQL bạn nên biết khi tham gia phỏng vấn trong ngành dữ liệu (Phần 1)

SQL ngày càng quan trọng trong doanh nghiệp với rất nhiều ứng dụng. Tuy nhiên, với các buổi phỏng vấn trong ngành dữ liệu, sẽ có một số nội dung quan trọng mà hầu hết các công ty đều kiểm tra. Dưới đây là 10 nội dung xuất hiện nhiều nhất vì có tính ứng dụng cao trong thực tế công việc.

Đây cũng là những nội dung bạn nên ôn tập để chuẩn bị cho buổi phỏng vấn sắp tới.

1. Case when

Bạn sẽ gặp nhiều câu hỏi yêu cầu sử dụng Case when, đơn giản vì sự đa dạng trong ứng dụng. Case when cho phép bạn viết các câu lệnh điều kiện phức tạp, xác định những giá trị hoặc nhóm nhất định phụ thuộc vào các biến khác.

Bên cạnh đó, Case when còn giúp bạn tạo pivot table.

Một câu hỏi VD: Write an SQL query to reformat the table so that there is a revenue column for each month.

2. Select distinct

Select distinct là một nội dung bạn cần nắm rõ, rất phổ biến khi kết hợp với aggregate functions.

VD: Nếu bạn có bảng về Customer orders (đơn hàng), bạn thường được yêu cầu tính số đơn hàng trung bình mỗi khách hàng mua. Trong trường hợp này, bạn sẽ tính Tổng số đơn hàng/ Tổng số khách hàng, như dưới đây:

3. Aggregate Functions

Liên quan đến ý bên trên, bạn cần nắm rõ các Aggregate Functions như min, max, sum, count,… Điều này cũng có nghĩa là bạn cần hiểu rõ về cách sử dụng GROUP BY và HAVING. Ở phần này, bạn nên dành nhiều thời gian thực hành, vì với cùng 1 câu hỏi có thể có nhiều cách khác nhau để sử dụng aggregate functions.

VD: Write a SQL query to find all duplicate emails in a table named Person.

4. Left Joins và Inner Joins

Với các bạn mới học SQL, Left Joins và Inner Joins thường dễ gây nhầm lẫn. Bạn cần hiểu rõ với từng phép join sẽ trả về kết quả khác nhau như thế nào. Trong các câu hỏi phỏng vấn, bạn sẽ được yêu cầu thực hành nội dung này, và biết nên sử dụng loại join nào chính là điều quan trọng nhất để trả lời đúng.

5. Self-joins

Chúng ta sẽ đến với một nội dung thú vị – self-join. Việc này phổ biến hơn bạn tưởng bởi vì trong thực tế, khi dữ liệu được lưu trong những bảng lớn thay vì nhiều bảng nhỏ, self-join được sử dụng để giải quyết một số vấn đề đặc biệt như ví dụ dưới đây.

Example Question: Given the Employee table below, write a SQL query that finds out employees who earn more than their managers. For the above table, Joe is the only employee who earns more than his manager.

Nguồn tham khảo: Towardsdatascience.com

Bên cạnh chỉ học thuộc các câu lệnh, việc hiểu rõ logic đằng sau mỗi câu lệnh, và cách áp dụng chúng trong những trường hợp cụ thể là rất quan trọng. Đây chính là sự khác biệt giữa một người biết SQL và một người có thể sử dụng SQL trong công việc.

Với đội ngũ giảng viên được đào tạo bài bản, nhiều năm kinh nghiệm phân tích và xử lý dữ liệu ở cả môi trường doanh nghiệp trong và ngoài nước, Datapot hướng tới mục tiêu cung cấp những khóa học đơn giản, hiệu quả và gắn liền với thực tiễn nhất có thể.

Tham khảo khóa học SQL for Data Analytics khai giảng 21/9 với đầy đủ các nội dung nêu trên.

Leave a Reply

Your email address will not be published. Required fields are marked *