Posted on Leave a comment

8 kĩ năng cần có để trở thành Data Analyst

Bạn đã quyết định bạn muốn trở thành Data Analyst. Bạn muốn bắt đầu tham gia vào ngành công nghiệp dữ liệu (Data Industry). Ở bất cứ trường hợp nào, bạn sẽ cần phải nắm vững các kỹ năng của Data Analyst để đạt được vị trí mà bạn mong muốn.

Nhưng những kỹ năng đó là gì? Bạn cần phải biết những gì? Trong bài viết này, bạn sẽ tìm hiểu tám kỹ năng chính mà bạn sẽ cần để có được công việc Data Analyst.

Chúng ta sẽ tập trung vào các kỹ năng chứ không tập trung vào các công cụ (như Python, R, SQL, Excel, PowerBI,.v.v…) Trọng tâm của bài viết sẽ là những việc bạn cần làm như một Data Analyst, chứ không phải bạn cách bạn làm những việc đó.

Các công cụ – cách thức – sẽ thay đổi tùy thuộc vào vị trí công việc cụ thể, công ty tuyển dụng bạn, và lĩnh vực bạn sẽ làm việc. Bạn có thể lấy các kỹ năng của Data Analyst từ bài viết này và áp dụng chúng bằng các công cụ mà bạn đang học, hoặc công cụ phù hợp với lĩnh vực mà bạn đang muốn tham gia.Bài viết này được chuẩn bị dựa trên chính kế hoạch cho lộ trình Data Analyst của Datapot. Để đảm bảo rằng chúng tôi không chỉ dựa vào kinh nghiệm của giảng viên, chúng tôi đã trao đổi với các Data Analyst, Data Scientist, CTO, CIO và những nhà tuyển dụng/nhà quản lý cẩn tuyển các vị trí về dữ liệu. Chúng tôi cũng đã tiến hành đánh giá các nghiên cứu khác.

1: Data Cleaning và Data Preparation

Các nghiên cứu cho thấy data cleaning và data preparation chiếm đến khoảng 80% công việc của các chuyên gia dữ liệu. Điều này có lẽ biến Data Cleaning và Data Preparation thành kỹ năng quan trọng cho bất cứ ai nghiêm túc tìm kiếm công việc về dữ liệu.

Thông thường, một Data Analyst sẽ cần lấy dữ liệu từ một hoặc nhiều nguồn và chuẩn bị để dữ liệu sẵn sàng cho việc phân tích. Việc làm sạch dữ liệu cũng liên quan đến việc xử lý những dữ liệu bị thiếu và không nhất quán mà có thể làm ảnh hưởng việc phân tích của bạn.

Data cleaning không phải lúc nào cũng được coi là “hấp dẫn”, nhưng data preparation có thể thực sự rất thú vị khi được coi là một bài toán giải quyết vấn đề. Trong bất cứ trường hợp nào, đây là nơi hầu hết các dự án dữ liệu bắt đầu, vì vậy nó là kỹ năng quan trọng mà bạn sẽ cần nếu bạn muốn trở thành Data Analyst

2: Data Analysis và Data Exploration

Nghe thì có vẻ hài hước khi liệt kê “Data Analysis” trong danh sách các kỹ năng cần thiết của Data Analyst. Nhưng bản thân việc phân tích vốn là một kỹ năng đặc biệt cần được nắm vững.

Về bản chất, data analysis có nghĩa là lấy một câu hỏi hoặc nhu cầu của doanh nghiệp và biến nó trở thành một câu hỏi dữ liệu. Rồi sau đó, bạn sẽ cần phải biến đổi và phân tích dữ liệu để lấy được câu trả lời cho câu hỏi đó.

Một hình thức khác của data analysis là data exploration. Data exploration là việc quan sát để tìm kiếm các xu hướng hoặc các mối quan hệ thú vị trong dữ liệu mà có thể mang lại giá trị cho doanh nghiệp.

Data Exploration có thể được khơi gợi bởi một câu hỏi kinh doanh, nhưng cũng có thể không phải. Bằng việc quan sát và tìm các hình mẫu và các điểm trong dữ liệu, bạn có thể nắm bắt cơ hội cho doanh nghiệp để giảm thiểu chi phí hoặc tăng trưởng.

3: Kiến thức thống kê

Một nền tảng vững chắc về xác suất thống kế là một kỹ năng quan trọng của Data Analyst. Kiến thức này sẽ giúp dẫn dắt việc phân tích và khai phá và giúp bạn hiểu dữ liệu mà bạn đang xử lý. 

Thêm vào đó, kiến thức xác suất sẽ giúp bạn đảm bảo việc phân tích của bạn có giá trị và sẽ giúp bạn tránh được các sai lầm và lỗi tư duy phổ biến.

Mức độ yêu cầu của kiến thức thống kê cần có sẽ thay đổi tùy thuộc vào các yêu cầu công việc cụ thể và dữ liệu bạn xử lý.

4: Data Visualization

Data Visualization khiến các xu hướng và hình mẫu trong dữ liệu dễ hiểu hơn. Loài người là sinh vật trực quan, và hầu hết mọi người sẽ không thể nắm được insight có ý nghĩa chỉ bằng cách nhìn vào một bảng tính số khổng lồ. Là một Data Analyst, bạn sẽ cần có khả năng tạo ra các sơ đồ và biểu đồ để giúp truyền đạt dữ liệu và phát hiện của bạn một cách trực quan.

Điều này đồng nghĩa với việc tạo ra các biểu đồ rõ ràng, hấp dẫn về mặt thị giác sẽ giúp người khác hiểu được dữ liệu. Điều này cũng có nghĩa là tránh những thứ khó diễn giải (như biểu đồ tròn) hoặc có thể gây hiểu nhầm (như thao túng các giá trị trục).

Visualization có thể cũng là một phần quan trọng của data exploration. Đôi khi có những điều trong dữ liệu chỉ có thể nhìn khi được trực quan hóa chứ không phải chỉ nhìn vào các con số.

Rất hiếm khi thấy công việc về dữ liệu mà không yêu cầu data visualization, điều này biến nó trở thành một kỹ năng quan trọng của Data Analyst.

5: Tạo các Dashboard và/hoặc báo cáo.

Là một Data Analyst, bạn sẽ cần giúp cho những người khác trong công ty có thể sử dụng dữ liệu để đưa ra các quyết định quan trọng. Bằng việc xây dựng các Dashboard và báo cáo, bạn sẽ giúp mọi người truy cập vào các dữ liệu quan trọng bằng cách xóa bỏ các rào cản kỹ thuật.

Việc này có thể ở hình thức biểu đồ và bảng biểu đơn giản với các bộ lọc theo ngày, cho đến Dashboard lớn chứa hàng trăm điểm dữ liệu tương tác và tự động cập nhật.

Các yêu cầu công việc có thể thay đổi rất nhiều từ vị trí này sang vị trí khác, nhưng hầu hết mọi vị trí Data Analyst sẽ liên quan đến tạo báo cáo và/hoặc xây dựng Dashboard để giới thiệu về các phát hiện của bạn.

6: Kỹ năng viết và giao tiếp

Khả năng giao tiếp ở nhiều hình thức là một kỹ năng quan trọng của Data Analyst. Viết, nói, thuyết phục, lắng nghe –kỹ năng giao tiếp tốt ở mọi lĩnh vực sẽ giúp bạn thành công.

Giao tiếp là chìa khóa trong việc hợp tác với các đồng nghiệp của bạn. Bạn sẽ phải làm việc với rất nhiều phòng ban để thu thập dữ liệu, yêu cầu, trình bày kết quả. Bạn cũng sẽ cần sự hỗ trợ từ rất nhiều đơn vị khác nhau để hoàn thành được công việc tốt nhất.

Giao tiếp bằng văn bản cũng cực kỳ quan trọng – gần như chắc chắn bạn sẽ cần phải viết báo cáo để trình bày các phân tích và đề xuất của bạn.

Rõ ràng, trực tiếp và dễ hiểu là kỹ năng sẽ thúc đẩy sự nghiệp của bạn trong ngành dữ liệu. Đây có thể là kỹ năng “mềm”, nhưng đừng đánh giá thấp nó – kỹ năng phân tích tốt nhất trên thế giới sẽ chẳng có giá trị nếu bạn không thể giải thích ý nghĩa của chúng và thuyết phục các đồng nghiệp có hành động dựa trên những phát hiện của bạn.

Giao tiếp tiếng Anh cả 4 kĩ năng là điều cần thiết nếu như bạn làm việc cùng với người nước ngoài. Kĩ năng đọc hiểu là bắt buộc vì một số các tài liệu chuyên ngành chỉ được viết bằng tiếng Anh.

7: Kiến thức chuyên ngành (Domain knowledge)

Kiến thức chuyên ngành là việc hiểu những điều đặc trưng của một lĩnh vực và công ty cụ thể mà bạn làm việc. Ví dụ, nếu bạn làm việc cho một công ty có cửa hàng trực tuyến, bạn có thể cần hiểu các sắc thái của thương mại điện tử. Trái lại, nếu bạn đang phân tích dữ liệu về các hệ thống cơ khí, bạn có thể cần phải hiểu những hệ thống đó và cách chúng hoạt động.

Kiến thức chuyên ngành thay đổi giữa các ngành nghề, vì vậy bạn có thể cần phải nghiên cứu và học hỏi một cách nhanh chóng. Bất kể bạn làm việc ở đâu, nếu bạn không hiểu những gì bạn đang phân tích, sẽ rất khó để làm điều đó một cách hiệu quả, điều này làm kiến thức chuyên ngành trở thành một kỹ năng quan trọng của Data Analyst.

Đây chắc chắn là điều mà bạn có thể học được trong công việc, nhưng nếu bạn biết một ngành hay lĩnh vực cụ thể mà bạn muốn làm việc, xây dựng nhiều hiểu biết nhất có thể sẽ giúp bạn trở thành một ứng viên sáng giá hơn và một nhân viên ấn tượng hơn một khi bạn được tuyển dụng.

8: Kỹ năng giải quyết vấn đề (problem solving)

Là một Data Analyst, bạn sẽ phải đối mặt với rất nhiều vấn đề, các lỗi kỹ thuật, và rào cản mỗi ngày. Khả năng giải quyết được các vấn đề đó chính là một kỹ năng quan trọng.

Bạn có thể cần nghiên cứu mặt hạn chế của một số phần mềm hoặc ngôn ngữ lập trình mà bạn đang sử dụng. Công ty của bạn có thể có những hạn chế về tài nguyên, buộc bạn phải sáng tạo trong cách tiếp cận vấn đề. Dữ liệu bạn đang sử dụng có thể không đầy đủ. Hoặc bạn có thể cần phải thực hiện một vài phân tích “đủ dùng” để cho kịp một deadline gấp.

Dù trong bất kỳ hoàn cảnh nào, kỹ năng giải quyết vấn đề tốt sẽ là một gia tài tuyệt vời cho bất kỳ Data Analyst nào.

Luôn luôn nhớ rằng Data Analyst không chỉ là toán, report, marchine learning hay AI…. Mục tiêu cuối cùng là giải quyết vấn đề cho doanh nghiệp. Những thứ trên chỉ là công cụ.

Các kỹ năng khác của Data Analyst

Định nghĩa chính xác của “Data Analyst” thay đổi rất nhiều tùy thuộc vào người mà bạn hỏi, vì vậy có thể không phải tất cả những kỹ năng này sẽ được yêu cầu cho mọi vị trí Data Analyst.

Tương tự, có thể có vài kỹ năng một số công ty sẽ yêu cầu mà không không nằm trong danh sách này. Mục đích của chúng ta là tìm ra nhóm kỹ năng mà hầu hết các vị trí Data Analyst yêu cầu để xây dựng lộ trình học phân tích dữ liệu tốt nhất cho học viên của chúng tôi.

Trong bài viết này, chúng tôi đã trình bày những kỹ năng bạn cần biết để trở thành một Data Analyst. Nếu bạn một tìm hiểu cách thức thực hiện và xây dựng nhóm kỹ năng bạn cần để tìm được công việc Data Analyst, hãy xem các khóa học phân tích dữ liệu của Datapot.

Posted on Leave a comment

SQL là gì? Tại sao bạn lại nên học SQL?

  1. SQL được sử dụng ở mọi nơi.
  2. Nhu cầu tuyển dụng ngày càng tăng vì nhiều công ty sử dụng SQL.
  3. Mặc dù có những lựa chọn khác, SQL sẽ không biến mất.

“SQL đã cũ. Đó, tôi đã nói rồi”

Lần đầu tôi nghe tới SQL là vào năm 1997. Tôi đang học cấp 3, và trong lớp tin học, chúng tôi làm việc với cơ sở dữ liệu trong Microsoft Access. Các máy tính chúng tôi sử dụng đã lỗi thời và lớp học thì thật nhàm chán. Ngay cả khi đó, SQL cũng có vẻ cổ lắm rồi.

SQL có từ khoảng 50 năm trước từ năm 1970 khi Edgar Codd, một nhà khoa học máy tính làm việc cho IBM, đã việc một bài báo mô tả một hệ thống mới dùng để quản trị dữ liệu trong những cơ sở dữ liệu. Trước cuối thập kỷ này, hệ thống của Codd đã có một vài mẫu thử nghiệm và một ngôn ngữ truy vấn – Ngôn Ngữ Truy Vấn Có Cấu Trúc (SQL) – đã ra đời để tương tác với những cơ sở dữ liệu này.

Nhiều năm sau đó, SQL đã được áp dụng rộng rãi. Việc học SQL (phát âm là “sequel” hoặc “S.Q.L”)  đã trở thành một nghi thức cho các nhà lập trình, những người cần làm việc với cơ sở dữ liệu trong thời gian dài.

Vậy tại sao một người muốn tìm được việc làm về dữ liệu nên dành thời gian học ngôn ngữ “cổ” này? Tại sao không dành toàn bộ thời gian để thuần thục Python/R, hay tập trung vào các kỹ năng về dữ liệu “hấp dẫn” hơn, như Deep Learning, Scala và Spark?

Mặc dù biết các nguyên tắc cơ bản của ngôn ngữ đa năng hơn như Python hay R là rất quan trọng nhưng việc bỏ qua SQL sẽ khiến việc kiếm việc làm về dữ liệu trở nên khó khăn hơn. Và sau đây chính là ba lý do chính:

1. SQL được sử dụng ở khắp mọi nơi

Hầu như tất cả các tên tuổi lớn nhất trong ngành công nghệ đều sử dụng SQL. Uber, Netflix, Airbnb – và rất nhiều công ty khác. Kể cả trong những công ty như Facebook, Google, và Amazon, những công ty đã tự xây dựng các hệ thống cơ sở dữ liệu có hiệu suất cao của riêng họ, các đội làm về dữ liệu đều sử dụng SQL để truy vấn dữ liệu và thực hiện phân tích.

Và không chỉ các công ty công nghệ: các công ty lớn và nhỏ đều sử dụng SQL. Ví dụ, chỉ cần tìm kiếm việc làm nhanh trên Linkedin sẽ chỉ cho bạn thấy rằng có nhiều công ty tìm kiếm kỹ năng SQL hơn là kỹ năng Python hay R. Mặc dù SQL có thể đã cũ, nhưng nó lại rất phổ biến.

Vicknesh, một data Scientist và là học viên cũ của Dataquest, đã có được công việc đầu tiên làm Data Analyst. Anh ấy nhanh chóng phát hiện ra mình sử dụng SQL hàng ngày: “SQL rất phổ biến, có có mặt ở mọi nơi. Như thể SQL tồn tại xuyên qua cả thời gian và không gian. Mọi thứ sử dụng SQL hoặc một ngôn ngữ phái sinh của SQL.”

2. SQL đang là nhu cầu

Nếu bạn muốn kiếm một công việc về dữ liệu, bạn nên tập trung vào các kỹ năng mà nhà tuyển dụng mong muốn. Để chứng minh tầm quan trọng của SQL đặc biệt là trong các công việc liên quan đến dữ liệu, tôi đã phân tích 25,000 công việc được đăng tuyển trên trang Indeed, xem xét các kỹ năng chính được đề cập trong những bài đăng tuyển có từ ‘dữ liệu’ trong tiêu đề:

Số lượng công việc về dữ liệu đề cập đến kỹ năng cụ thể

Dễ thấy SQL là kỹ năng được nhắc đến nhiều nhất, được đề cập tới trong 35.7% bài đăng tuyển, nhiều gấp 1.39 lần so với Python và gấp đôi số bài đăng tuyển so với R.

Điều gì sẽ xảy ra nếu bạn đang tìm kiếm công việc đầu tiên về dữ liệu? Liệu SQL sẽ được yêu cầu ngay cả với các vị trí mức entry-level? Hầu hết các công việc ở mức entry-level về dữ liệu là các vị trí Data Analyst, vì vậy tôi đã xem các bài tuyển dụng có từ ‘data analyst’ trong tên vị trí, và những con số này thậm chí còn thuyết phục hơn:

Số lượng công việc có từ khóa ‘data analyst’ đề cập đến kỹ năng cụ thể

Đối với các vị trí Data Analyst, SQL được đề cập trong phần lớn các bài tuyển dụng, nhiều gấp 3 lần so với Python và R. Tóm lại là: Đúng vậy, bạn cần phải học SQL. Nó sẽ không chỉ giúp bạn đủ điều kiện cho những công việc này, hơn nữa còn làm bạn khác biệt với những ứng viên khác, những người chỉ tập trung vào những thứ “hấp dẫn”.

3. SQL sẽ không biến mất

Với các data scientist và data engineer SQL phổ biến hơn Python và R. Việc SQL là ngôn ngữ được lựa chọn là vô cũng quan trọng. Trong biểu đồ dưới đây, từ khảo sát developer năm 2017 của StackOverflow, chúng ta có thể thấy rằng SQL làm lu mờ cả Python lẫn R về mức độ phổ biến.

Khảo sát Developer của StackOverflow năm 2017

Trong khảo sát năm 2018 của StackOverflow, kết quả vẫn tương tự. Tôi đã thực hiện một phân tích ngắn về dữ liệu khảo sát thô và với các dev làm Data Analyst hoặc Data Scientist, SQL được sử dụng phổ biến hơn Python, R hoặc bất kỳ ngôn ngữ nào khác.

Các ngôn ngữ được các Data Scientist và Data Analyst sử dụng, Khảo sát năm 2018 của StackOverflow

Mặc dù có rất nhiều sự thổi phồng xung quanh NOSQL, Hadoop và các công nghệ khác, SQL vẫn là một trong những ngôn ngữ phổ biến nhất không chỉ với những người trong lĩnh vực dữ liệu mà còn với cả developer ở tất cả lĩnh vực khác. Trong nghiên cứu năm 2019 của StackOverflow, SQL là ngôn ngữ phổ biến thứ ba nói chung và mặc dù dữ liệu thô từ khảo sát đó chưa được phát hành, nhưng có lẽ năm nay SQL vẫn giữ được vị trí quan trọng trong số các ngôn ngữ khoa học dữ liệu.

Điều này mang đến cho những người thực hành dữ liệu đầy tham vọng sự tự tin là họ không học một ngôn ngữ đang chết dần mà thay vào đó là học ngôn ngữ chung của dữ liệu.

4. Vậy Datapot có thể giúp gì cho bạn?

Khóa học SQL for Data Analytics của Datapot được thiết kế để cung cấp các khái niệm và ứng dụng cơ bản trong phân tích dữ liệu của ngôn ngữ truy vấn có cấu trúc  SQL (Structured Query Language).

Chúng mình hy vọng rằng, sau khi kết thúc khóa học, các bạn sẽ hiểu được các nguyên tắc cơ bản của Cơ sở dữ liệu quan hệ và Ngôn ngữ truy vấn có cấu trúc (SQL), sử dụng các câu lệnh SQL để thiết kế và tùy chỉnh cơ sở dữ liệu cũng như lưu trữ, truy xuất và thao tác với dữ liệu trong cơ sở dữ liệu quan hệ và có thể ứng dụng SQL trong phân tích dữ liệu.

Datapot hẹn gặp các bạn trong các khóa đào tạo SQL for Data Analytics của Datapot.
Để tìm hiểu lịch khai giảng gần nhất các bạn truy cập đường link tại đây nhé: Lịch Khai Giảng