Posted on Leave a comment

DAX Cheat Sheet (Part 1)

Data Analysis Expressions (DAX) là một thư viện các hàm và phép tính mà có thể kết hợp với nhau để xây dựng các công thức, biểu thức trong Power BI và Power Pivot trong Excel.

Tìm hiểu về DAX là gì? Ví dụ về cách sử dụng, các bạn có thể tham khảo video này:

Trong bài viết này, Datapot sẽ chia sẻ với bạn nội dung DAX Cheat sheet về các hàm tính toán cơ bản và hàm MTD để bạn có thể tham khảo và áp dụng trong công việc nhé!

Month To Date Sales
• Month-to-date (MTD): là một khoảng thời gian bắt đầu từ đầu tháng và kết thúc ở ngày hiện tại trong tháng đó.
• Month-to-date được sử dụng trong nhiều trường hợp, điển hình là để tính kết quả của một hoạt động trong khoảng thời gian từ đầu tháng đến ngày hiện tại. Ví dụ: nếu ngày hôm nay là ngày 15, bạn được sếp yêu cầu tính sales trong tháng hiện tại, bạn sẽ tính tổng sales từ ngày 1 đến ngày 14 (ngày 15 chưa kết thúc).

Các bạn hãy tiếp tục theo dõi các bài viết tiếp theo của Datapot để tìm hiểu về Dax nhé!

Posted on Leave a comment

Ví dụ về Tư duy phân tích & ứng dụng dữ liệu để trả lời câu hỏi

Đây là ví dụ tôi thường dùng để giúp mọi người bắt đầu với dữ liệu (với 1 cây bút, giấy và máy tính).

Ví dụ này sẽ không biến bạn trở thành chuyên gia về dữ liệu, tuy nhiên sẽ giúp bạn cảm thấy quen thuộc hơn với dữ liệu cũng thấy được những cơ hội từ việc phân tích dữ liệu.

Chúng ta sẽ bắt đầu với một hiện tượng – trễ giờ họp.

Xác định câu hỏi: Có phải các cuộc họp luôn diễn ra muộn hơn so với thời gian dự kiến. Điều này có đúng không?

Tiếp theo, hãy nghĩ đến các dữ liệu có thể giúp bạn trả lời câu hỏi này cũng như một kế hoạch để tìm ra chúng. Viết ra các định nghĩa và quy trình để thu thập dữ liệu. VD, định nghĩa về thời điểm cuộc họp bắt đầu. Đó là lúc có người nói “Chúng ta bắt đầu họp nào!” ? Và bạn có thể để ý, khi có thêm người mới (đặc biệt là lãnh đạo), cuộc họp gần như sẽ bắt đầu lại từ đầu. Vậy bạn nên chọn mốc thời gian nào?

Tiếp theo bạn có thể bắt đầu việc trình bày. Việc trình bày tốt giúp bạn hiểu rõ dữ liệu cũng như trao đổi, truyền đạt với mọi người dễ dàng hơn. Có nhiều công cụ nhưng trong ví dụ này tôi sẽ vẽ tay. Tôi có một biểu đồ như hình dưới với trục x là thời gian trong ngày (các ngày trong tuần) và trục y là số phút muộn họp. 

Chúng ta hãy trở lại với câu hỏi ban đầu và đưa ra một số nhận xét. Theo biểu đồ, trong vòng 2 tuần, 10% cuộc họp diễn ra đúng giờ, và số phút muộn trung bình là 12 phút. 

Bạn không nên dừng lại ở đây. Hãy tiếp tục đặt câu hỏi: Thì sao? Nếu như 2 tuần này là điển hình, thì tôi lãng phí 1 giờ mỗi tuần, điều này tiêu tốn của công ty 1 số tiền x mỗi năm.

Sự phân tích sẽ kết thúc nếu bạn không đặt thêm các câu hỏi. Nếu như 80% các cuộc họp diễn ra trong khoảng vài phút so với giờ hẹn ban đầu thì chúng ta có thể trả lời câu hỏi ban đầu rằng các cuộc họp diễn ra đúng giờ và dừng việc phân tích.

Nhưng trong trường hợp này, ta có thể phân tích thêm.

Cùng tìm hiểu về phương sai (variation). Theo như biểu đồ thì thời gian muộn từ 8 – 20 phút là điển hình. 1 số cuộc họp diễn ra đúng giờ, 1 số khác lại muộn đến 30 phút. Sẽ là lý tưởng nếu bạn có thể kết luận rằng nếu đi muộn 10 phút thì sẽ đúng lúc cuộc họp bắt đầu, tuy nhiên phương sai ở đây là quá lớn để kết luận như vậy.

Từ dữ liệu chúng ta còn có thể biết thêm gì nữa? Trong 6 cuộc họp diễn ra đúng giờ, nếu tìm hiểu kỹ hơn, có thể thấy 6 cuộc họp này đều do Phó giám đốc về tài chính phụ trách. Từ đây bạn có thể làm gì tiếp?

Ở mức độ cá nhân, để tiết kiệm thời gian, chúng ta có thể học tập phó giám đốc để tìm ra những cách giúp cuộc họp diễn ra đúng giờ.

Ở mức độ công ty, chúng ta chưa rõ kết quả này đã là điển hình hay chưa, liệu các lãnh đạo khác có giúp việc họp diễn ra đúng giờ như Phó giám đốc về tài chính hay không. Từ đó có thể đặt ra một số câu hỏi như: Kết quả có đồng nhất giữa người tổ chức họp hay không, có ngày cụ thể nào trong tuần ảnh hưởng đến việc họp muộn hay không. Hay xa hơn là nên họp qua video call hay họp trực tiếp? Hoặc có mỗi quan hệ giữa cấp bậc của người tổ chức họp và số phút muộn hay không?

Với mỗi hoặc 1 vài câu hỏi như thế này, bạn quay lại bước đầu, thực hiện lại các bước, từ đó tìm ra kết luận. Với dữ liệu, bạn có thể hiểu rõ hơn về hiện tượng trễ giờ họp, từ đó đưa ra một số hướng giải quyết.

Việc sử dụng Tư duy phân tích và phân tích dữ liệu không hề xa lạ, mà nếu được thực hiện hiệu quả, có thể giúp cải thiện hoạt động của tổ chức.

Nguồn: Thomas C. Redman – Havard Business Review Press

Posted on Leave a comment

Business Analyst – Làm sao để đương đầu với những yêu cầu mơ hồ?

Đối với một BA, việc phải giải quyết những vấn đề mơ hồ, không đủ thông tin hoặc tham gia vào các dự án không rõ yêu cầu, không rõ định hướng là một chuyện hết sức quen thuộc. Bản thân stakeholder khi đó có thể chưa thực sự biết mình muốn gì, vấn đề họ gặp phải là gì hay sản phẩm họ cần hình hài sao? Vậy BA cần phải làm gì trong những tình huống này?

Thay vì lao vào nghĩ đủ giải pháp để giải quyết vấn đề stakeholder đưa ra, công việc của BA là đặt câu hỏi và làm rõ yêu cầu, làm rõ vấn đề cần giải quyết để đưa ra được giải pháp tối ưu nhất. Lúc này, kỹ năng khơi gợi yêu cầu thực sự sẽ phát huy sức mạnh nếu BA có thể linh hoạt sử dụng cho từng tình huống. Vậy Khơi gợi yêu cầu liệu có phải chỉ là ngồi phỏng vấn stakeholder hay không?Trên thực tế, Khơi gợi yêu cầu là quá trình thu thập thông tin từ stakeholder để làm rõ nhu cầu của họ từ đó làm tiền đề cho việc đề xuất giải pháp tối ưu. Để thực hiện quá trình này, BA có thể linh hoạt kết hợp nhiều kỹ thuật khác nhau tùy vào từng điều kiện cụ thể của dự án để đạt được mục đích của mình. Các kỹ thuật thường được sử dụng trong quá trình khơi gợi yêu cầu bao gồm:

  • Phỏng vấn
  • Survey
  • Quan sát
  • Phân tích tài liệu
  • Prototyping
  • Brainstorming
  • Workshop

Hầu hết BA đều sẽ quen thuộc với kỹ thuật Phỏng vấn stakeholder để lấy thông tin, tuy nhiên các bạn cần lưu ý việc hỏi “đúng người”, hỏi “đúng trọng tâm” để nhận được “thông tin đầy đủ và đúng” phục vụ cho dự án, tránh làm mất thời gian của cả hai bên.

Sau khi đã làm rõ nhu cầu của stakeholder, không ít bạn vẫn thường gặp rối không biết bắt đầu từ đâu làm gì trước, làm gì sau, không biết như vậy đã đủ yêu cầu chưa, như thế nào thì dự án mình tham gia được đánh giá là hiệu quả?

Hãy dừng nhận việc và lao vào làm như thiêu thân rồi nhận lại những cái lắc đầu của stakeholder do sản phẩm không đạt yêu cầu? Vậy mục tiêu của dự án là gì, bạn cần làm rõ ngay khi bắt đầu vào dự án. Việc xác định rõ mục tiêu của dự án sẽ giống kim chỉ nam giúp bạn vạch ra được các công việc cần làm, xác định được con đường cần đi chứ không phải đi “mò”. Việc xác định rõ mục tiêu từ đầu cũng giúp bạn có thể xác định được các yêu cầu lưu trữ dữ liệu cần thiết phục vụ đo đạc hiệu quả và phân tích hành vi người dùng.

Hiểu được những vấn đề các bạn BA thường gặp phải trong quá trình làm việc, Datapot đã cùng cùng với chị Nhân Cao – một Trading Products Manager với gần 10 năm kinh nghiệm trong lĩnh vực phát triển sản phẩm/ phần mềm, thiết kế khóa học Essential Skills for Data Driven Business Analyst với mong muốn hỗ trợ các bạn cải thiện hiệu suất và hiệu quả công việc, cũng như nâng cao năng lực cạnh tranh của bản thân trong doanh nghiệp.

Posted on Leave a comment

Các loại hình phân tích dữ liệu

Phân tích dữ liệu (Data Analysis) là một quá trình bao gồm: xác định, làm sạch, biến đổi & mô hình hóa, trực quan hóa dữ liệu để khám phá ra những thông tin ý nghĩa và hữu ích. Những thông tin này được thể hiện qua những báo cáo phân tích, từ đó hỗ trợ cho quá trình ra quyết định.

Hoạt động phân tích dữ liệu có thể phân loại như sau

  • Descriptive (Mô tả)
  • Diagnostic
  • Predictive (Dự đoán)
  • Prescriptive
  • Cognitive

Descriptive analytics

Descriptive analytics (Phân tích mô tả) giúp trả lời các câu hỏi về điều gì đã xảy ra dựa trên các dữ liệu quá khứ. Các kỹ thuật phân tích mô tả sẽ tổng hợp lượng dữ liệu lớn và từ đó đưa ra kết quả.

Với việc phát triển các chỉ tiêu đo lường hiệu quả (KPI), việc theo theo dõi thành công hay thất bại của các mục tiêu sẽ trở nên dễ dàng hơn. Chỉ tiêu như ROI (return on investment) được sử dụng trong rất nhiều lĩnh vực. Và ở mỗi lĩnh vực, lại có những chỉ tiêu chuyên môn riêng được phát triển để đo lường hiệu quả.

Một ví dụ của phân tích mô tả là chính là các báo cáo theo dõi kết quả hoạt động bán hàng hoặc tình hình tài chính của doanh nghiệp.

Diagnostic analytics

Phân tích chuẩn đoán giúp trả lời câu hỏi tại sao tình trạng này lại diễn ra. Phân tích chuẩn đoán bao gồm các phân tích mô tả cơ bản, sử dụng những kết quả của phân tích mô tả để từ đó tìm ra nguyên nhân của các sự kiện. Từ đó, những chỉ số đo lường hiệu quả được phân tích kỹ hơn. Quá trình này thường bao gồm 3 bước:

  1. Tìm ra những điểm bất thường trong dữ liệu. Những điểm này thường là một biến đổi không lường trước được ở một chỉ số hoặc một thị trường nào đó.
  2. Thu thập các dữ liệu liên quan đến những điểm bất thường này.
  3. Sử dụng các kỹ thuật thống kê để tìm ra mối quan hệ và xu hướng giúp giải thích những điểm bất thường này.

Predictive analytics

Phân tích dự đoán giúp trả lời các câu hỏi về điều gì sẽ xảy ra trong tương lai. Phân tích dự đoán sử dụng các dữ liệu quá khứ để xác định các xu hướng cũng như khả năng xảy ra của xu hướng đó. Những công cụ phân tích dự đoán cung cấp những thông tin giá trị về tình hình tương lai. Các kỹ thuật phân tích dự đoán đa dạng bao gồm cả các kỹ thuật thống kê lẫn học máy (machine learning) như neural networks, decision trees và hồi quy (regression).

Prescriptive analytics

Phân tích đề xuất giúp trả lời các câu hỏi về hành động nào nên được thực hiện để đặt được một mục tiêu nhất định. Bằng cách sử dụng các kết quả từ phân tích đề xuất, các tổ chức có thể ra quyết định dựa trên dữ liệu. Phương pháp này giúp các tổ chức đưa ra các quyết định trong các hoàn cảnh không chắc chắn. Phân tích đề xuất dựa trên học máy (machine learning) để tìm ra các pattern trong các dataset lớn. Bằng cách phân tích các quyết định & sự kiện trong quá khứ, các tổ chức có thể ước lượng xác suất xảy ra của các kết quả.

Cognitive analytics

Cognitive analytics diễn giải từ các dữ liệu và các pattern đã có, đưa ra các kết luận dựa trên kiến thức hiện tại, sau đó lại thêm những kết quả này vào vốn kiến thức hiện tại để tiếp tục đưa ra các diễn giải về tương lai, tạo ra một vòng lặp tự học hỏi. Cognitive analytics giúp bạn tìm hiểu điều gì sẽ xảy ra nếu tình hình thay đổi và quyết định bạn nên giải quyết các tình huống đó như thế nào.
Các diễn giải không phải là những truy vấn có cấu trúc trên những dữ liệu quy chuẩn, thay vào đó, là những dự đoán không có cấu trúc được thu thập từ nhiều nguồn với độ tin cậy thay đổi. Cognitive analytics hiệu quả phụ thuộc vào các thuật toán học máy, và sẽ sử dụng các concept về xử lý ngôn ngữ tự nhiên để phân tích các nguồn dữ liệu chưa được dùng tới, ví dụ như nhật ký cuộc gọi bán hàng hay review sản phẩm.

Các nội dung trên được Microsoft cung cấp cho các ứng viên tham gia thi chứng chỉ Data Analyst Associate. Đây là chứng chỉ role-based của Microsoft, nhằm đánh giá các kỹ năng của Data Analyst, ứng dụng công cụ BI là Power BI.

Theo dõi các bài viết tiếp theo, trao đổi kinh nghiệm & tài liệu luyện chi chứng chỉ của Microsoft cho Data Analyst tại group Microsoft Certified: Data Analyst Associate Việt Nam (DA-100).

Posted on Leave a comment

Bắt đầu trong ngành dữ liệu với chứng chỉ nào? So sánh 3 chứng chỉ dành cho Data Analyst, BI Analyst

Triển vọng của lĩnh vực BI tại Việt Nam

Trong kỷ nguyên của dữ liệu, khi vai trò của dữ liệu với thành công của doanh nghiệp ngày càng lớn, lĩnh vực Business Intelligence ngày càng phát triển. Với một chiến lược và một team BI tốt, doanh nghiệp có thể thực hiện các phân tích cần thiết hỗ trợ cho các quyết định kinh doanh dựa trên dữ liệu.

Báo cáo trong Glassdoor và PayScale cho thấy, nếu bạn mới vào nghề (có 1- 2 năm kinh nghiệm), bạn có thể tính vào mức lương trung bình 66.000 đô la. Khi bạn đã đạt được một vài năm kinh nghiệm và bạn đã mài giũa kỹ năng thuyết phục của mình, mức lương trung bình hàng năm của bạn có thể đạt 79.000 đô la.

Tại Việt Nam, dù chưa có số liệu thống kê chính thức, nhưng nếu xem qua các tin tuyển dụng, bạn có thể thấy mức lương của BI Analyst dưới 2 năm kinh nghiệm ở Việt Nam dao động trong khoảng 10 – 25 triệu/ tháng.

Lĩnh vực có nhu cầu cao về BI Analyst hiện nay là Ngân hàng, bán lẻ, tài chính, thương mại điện tử,.. vì có lượng khách hàng phổ thông lớn, lượng dữ liệu nhiều.

Thi chứng chỉ tạo lợi thế cạnh tranh cho bạn trong ngành dữ liệu như thế nào?

Kiến thức, kỹ năng là những thứ khó có thể đo lường, xác định rõ ràng, với cả ứng viên và nhà tuyển dụng. Chính vì vậy, với mọi ngành nghề, lĩnh vực, sẽ đều có những chứng chỉ, bài thi như một thang đo để đánh giá năng lực. Ví dụ như CFA với ngành tài chính, MOS cho tin học văn phòng hay IELTS/ TOEFL cho tiếng Anh.

Với ngành dữ liệu – cụ thể là lĩnh vực Data Analytics, Business Intelligence, việc học và thi chứng chỉ chưa thực sự phổ biến tại Việt Nam. Tuy nhiên việc thi chứng chỉ mang lại 3 lợi ích rõ ràng như sau:

1. Có mục tiêu học tập và lộ trình ôn luyện rõ ràng. Không bị lan man.

2. Được xác nhận trên một mức level cụ thể của một kĩ năng (không chỉ với người khác mà với chính bản thân bạn, vì khi biết rõ level của bạn thân bạn sẽ biết mình cần phát huy gì, cần cải thiện gì).

3. Là 1 cách để đảm bảo, chứng minh khả năng của bản thân với nhà tuyển dụng, nhất là với các bạn sinh viên, fresher, người chuyển ngành muốn theo đuổi mảng dữ liệu nghiêm túc nhưng chưa có kinh nghiệm làm việc.

So sánh 3 chứng chỉ dành cho BI Analyst, Data Analyst

Với 3 công cụ BI phổ biến nhất hiện nay là Power BI, Tableau và Qlik, chúng ta có 3 chứng chỉ tương ứng như sau:

Bắt đầu với chứng chỉ nào?

Với các bạn đã đi làm, các bạn có thể lựa chọn chứng chỉ dựa theo công cụ công ty bạn đang làm  (hoặc muốn làm ) sử dụng. Tuy nhiên, với những bạn mới ra trường hay chưa xác định được công ty, thi chứng chỉ Data Analyst Associate là lựa chọn hợp lý hơn vì 3 lý do sau:

1, Được cấp bởi Microsoft  & Sự phổ biến của Power BI

Với sự phổ biến của các công cụ Microsoft Office tại Việt Nam như Excel, PowerPoint,… Power BI cũng là công cụ được ưu tiên lựa chọn bởi các doanh nghiệp Việt Nam, vì có cùng hệ sinh thái cũng như có những điểm vượt trội nhất định. Chính vì vậy, với DAA thì bạn sẽ có nhiều cơ hội về công việc hơn cũng như tạo một sự tin tưởng cho nhà tuyển dụng.

2. Chứng chỉ Role-Based thay vì Tech-based

Khác với 2 chứng chỉ của Qlik và Tableau tập trung vào khả năng sử dụng công cụ (cụ thể bạn có thể xem ở website của 2 chứng chỉ này), DAA tập trung vào các kỹ năng cần thiết để trở thành một Data Analyst (và việc sử dụng Power BI để thực hành các kỹ năng này). Dưới đây là list các kỹ năng bạn sẽ cần học và ôn luyện cho chứng chỉ DAA:

  • Prepare the data
  • Model the data
  • Visualize the data
  • Analyze the data
  • Deploy and maintain deliverable

3. Tiết kiệm chi phí và thời gian học.

Tìm hiểu thêm về DAA tại: https://docs.microsoft.com/en-us/learn/certifications/data-analyst-associate#certification-exam-disclaimers

Tìm hiểu về khóa học Luyện thi chứng chỉ DAA tại Việt Nam tại:

Posted on Leave a comment

Các loại câu lệnh SQL

Mọi người đa phần đều đã thao tác với các câu lệnh SQL tuy nhiên ít ai để ý đến việc phân loại các câu lệnh này. Trong bài viết này Datapot sẽ phân loại và giới thiệu mục đích sử dụng của các loại câu lệnh phổ biến trong SQL. Save bài viết này để khi gặp môt yêu cầu nào đó mà không biết dùng loại câu lệnh nào, bạn có thể tra cứu lại nhé!

Image may contain: text
No photo description available.
No photo description available.
Image may contain: text
Image may contain: text
Image may contain: text
Image may contain: text

Ngoài ra, để được hướng dẫn chi tiết hơn về cách ứng dụng SQL trong Phân tích dữ liệu & trong môi trường doanh nghiệp, tham khảo khóa học SQL Redash for Data Analytics Online (Khai giảng 3/6) tại Datapot nhé!

Posted on Leave a comment

Kỹ năng nào là cần thiết với một BA mới vào nghề?

Nếu bạn đang tìm hiểu về vị trí Business Analyst và thắc mắc bạn cần chuẩn bị những kỹ năng và kinh nghiệm gì thì bài viết này dành cho bạn.

Các nhóm kỹ năng cần thiết đối với một BA mới vào nghề phải kể đến: 

  1. Nhóm kỹ năng nền tảng
  2. Nhóm kỹ năng chuyên môn
  3. Nhóm kỹ năng mềm.

1. NHÓM KỸ NĂNG NỀN TẢNG

Kỹ năng giao tiếp

BA phải là một người giỏi giao tiếp. Họ có thể tổ chức thành công các buổi họp không chỉ gặp mặt trực tiếp mà ngay cả các buổi họp trực tuyến, biết lắng nghe và tiếp nhận các ý kiến cũng như biết cách đặt vấn đề để khai thác tối đa các nguồn thông tin trong buổi họp.

Kỹ năng giải quyết vấn đề

Không một dự án nào là không có vấn đề. Trên thực tế, toàn bộ dự án đã chính là một giải pháp cho một vấn đề. BA được xem như là người tạo điều kiện giúp mọi người nắm được thông tin chung về vấn đề, các giải pháp khả thi và xác định phạm vi của dự án. BA cũng là người hỗ trợ giải quyết các thách thức kỹ thuật, đặc biệt trong việc giải quyết các vấn đề phát sinh giữa bên kinh doanh và kỹ thuật.

Kỹ năng tư duy phản biện

BA là người chịu trách nhiệm đánh giá các lựa chọn trước khi cùng team giải quyết một vấn đề. Khi xác định được vấn đề cần giải quyết, BA cần lắng nghe nhu cầu của các bên liên quan đồng thời phải xem xét các nhu cầu đó và đặt câu hỏi thăm dò để hiểu rõ và nắm được nhu cầu thực sự. Đây cũng chính là lý do tư duy phản biện trở nên quan trọng với các BA.

2. NHÓM KỸ NĂNG CHUYÊN MÔN

Kỹ năng kết nối và chuẩn hóa tài liệu

Các kỹ thuật liên kết giúp BA nắm rõ và hiểu chính xác nhu cầu thực sự của các bên liên quan trong quá trình khám phá thông tin. Glossary và User Stories được coi là một trong các kỹ thuật để nắm bắt và truyền đạt thông tin liên quan đến yêu cầu với các bên liên quan.

BA cũng cần phải quản lý và lưu trữ được các tài liệu về dự án. Các yêu cầu, nội dung các cuộc họp, trao đổi, các tài liệu xoay quanh dự án đều cần được sắp xếp và tổ chức khoa học.

Kỹ năng phân tích

BA sử dụng rất nhiều kĩ thuật để phân tích vấn đề và giải pháp. Khi mới vào nghề, bạn sẽ phân tích vấn đề một cách tự nhiên. Nhưng khi có nhiều kinh nghiệm hơn bạn sẽ biết cách sử dụng các kĩ thuật để tiến hành phân tích và mổ xẻ vấn đề một cách hiệu quả hơn.

Với mỗi trường hợp, BA sẽ áp dụng các kĩ thuật phân tích phù hợp như:

–          Business-Level: BA sẽ áp dụng các a textual model visual model (flow diagram) để phân tích một quy trình kinh doanh.

–          Software-level: usercasewireframe được sử dụng để phân tích cách một phần mềm hỗ trợ quy trình kinh doanh.

–          Information-level: BA sử dụng data modeling techniques như Mô hình quan hệ thực thể (ERD), data dictionary, data map, and system context diagram để hiểu dữ liệu và thông tin được lưu trữ và duy trì như thế nào.


Các công cụ hỗ trợ việc phân tích

Ngoài việc thành thạo các ứng dụng văn phòng như: Word, Excel, PowerPoint, BA cần biết sử dụng một số công cụ khác: Công cụ để modeling như Visio hoặc Enterprise Architech; Công cụ để quản lý yêu cầu như DOORS hoặc Caliber; Công cụ để quản lý dự án như: Microsoft Project; Công cụ phân tích như: Power BI, Tablue,..

3. NHÓM KỸ NĂNG MỀM

Kỹ năng xây dựng quan hệ

Đầu tiên và quan trọng nhất trong danh sách các kỹ năng mềm là kỹ năng xây dựng quan hệ, thường được gọi là quan hệ giữa các bên liên quan. Bên liên quan là bất cứ ai có đóng góp cho dự án của bạn và thường bạn sẽ làm việc với nhiều bên liên quan từ doanh nghiệp đến đội kỹ thuật.

Kỹ năng này liên quan đến việc xây dựng niềm tin và BA có vai trò lãnh đạo nhóm dự án để thu hẹp khoảng cách giữa các bên.

Kỹ năng tự quản lý công việc

BA không phải là người quản lý dự án, tuy nhiên việc tự quản lý công việc là một kỹ năng quan trọng với một người BA thành công. Ngoài ra, BA cũng cần trang bị thêm các kỹ năng như: kỹ năng quản lý thời gian, kỹ năng đặt mục tiêu, kỹ năng quản lý rủi ro.

Kỹ năng “Thick Skin”

BA sẽ nhận được một loạt các phản hồi về tài liệu và các giải pháp đã được đề xuất. Để trở thành một BA thành công, bạn cần công tư phân minh, nghĩa là có khả năng tách biệt các phản hồi về tài liệu với các ý kiến về cá nhân bạn.

Kỹ năng đối mặt với “sự mơ hồ”

BA coi “sự mơ hồ” là kẻ thù không đội trời chung. Sự mơ hồ trong các yêu cầu kỹ thuật có thể dẫn đến những lỗ hổng không lường trước được. Sự mơ hồ trong cuộc trò chuyện có thể dẫn đến những xung đột không cần thiết. Ở mỗi giai đoạn của một dự án, nhiệm vụ của BA là làm rõ và giải quyết sự mơ hồ.

Tuy nhiên, khi bắt đầu một dự án, trước khi hiểu đầy đủ vấn đề và đưa ra giải pháp, một BA phải có khả năng nắm bắt sự mơ hồ và làm việc hiệu quả thông qua sự mơ hồ đó. Quản lý sự mơ hồ có nghĩa là nắm bắt được thông tin mới và tìm hiểu ngay khi nó xuất hiện.

Trên đây là những kỹ năng cần thiết nhất đối với một người mới bước chân vào nghề BA. Nếu bạn đang quan tâm đến nghề BA hoặc bạn đang làm việc với vai trò BA thì hãy trang bị cho mình các kỹ năng này ngày một nhuần nhuyễn nhé.

Nguồn: https://www.bridging-the-gap.com/business-analyst-skills-important/

https://home.datapot.vn/product/data-for-ba/

Posted on Leave a comment

Lời chào tạm biệt Big Data?

Trước đây, khi học Thạc sĩ về Data Science, các topic về Big Data luôn khiến tôi hào hứng. Tôi muốn tìm hiểu về 3Vs, muốn phân tích các dòng dữ liệu, mô hình hóa, trực quan hóa, biến đổi,… Đến bây giờ, khi ai đó nhắc đến Big Data, tôi nghĩ ngay đến một đống Buzzwords và những kỳ vọng mơ hồ.  

“Buzzword” is “a word or expression from a particular subject area that has become fashionable by being used a lot, especially on television and in the newspapers”.

“Buzzword” là “những từ, cụm từ có tính chuyên ngành nhưng được sử dụng rộng rãi theo cách thời thượng, xu hướng, đặc biệt là bởi giới truyền thông”.

Cambridge Dictionary

Có phải Big Data đã mất đi sức hấp dẫn? Hay do tôi trở nên ngày càng hoài nghi?

Khoảng cách giữa Buzzword và Thực tế

Tôi trở nên khá dị ứng với các “buzzword”. Chúng thường được thổi phồng quá mức so với ý nghĩa thực tế. Một ví dụ là bạn sẽ thấy một câu quen thuộc như thế này: Big Data mang đến những đột phá trong kỷ nguyên digital. Nghe rất hứa hẹn tuy nhiên trong thực tế chúng ta vẫn đang vẫn đang mắc kẹt với những sheet Excel.

Big Data khiến mọi người háo hứng bởi ý tưởng về kho báu, hay nguồn tài nguyên khổng lồ mà chúng ta có thể tận dụng. Ấn tượng của tôi ban đầu cũng như vậy, rằng trong lượng dữ liệu khổng lồ đó, chắc chắn phải có gì đó giá trị. Điều này là có thể, tuy nhiên với mức chi phí là bao nhiêu?

Không thể sử dụng Big Data nếu không có cơ sở hạ tầng phù hợp

Làm việc với lượng dữ liệu khổng lồ yêu cầu những công nghệ nhất định, cách lưu trữ và các công cụ phù hợp để chuyển đổi dữ liệu. “Nút cổ chai” xảy ra thường xuyên hơn bạn nghĩ, khi công nghệ phát triển và dễ tiếp cận với các nền tảng điện toán đám mây, việc sử dụng và duy trì các các nền tảng này cũng tốn một chi phí rất lớn. Đây cũng là một trong những bài học thế kỷ về dữ liệu:

Khi dữ liệu trở nên quý như vàng đối với một số người, thì nó lại làm lãng phí nơi lưu trữ với một số người khác.

Các công ty lưu trữ dữ liệu và trả chi phí lưu trữ, sau đó mới biết được dữ liệu có hữu dụng hay không. Vậy tại sao không quyết định dữ lữu nào sẽ hữu dụng trước sau đó mới lưu trữ?

Big Data không phải lúc nào cũng là “Interesting Data”

“Garbage in, garbage out” (Đầu vào kém thì đầu ra cũng kém) là một trong những câu nói quan trọng nhất trong lĩnh vực Khoa học dữ liệu.  Và rất nhiều dữ liệu được coi là “Big Data” nằm trong nhóm này, nghĩa là đó là những dữ liệu không đáng tin cậy,  chưa được xử lý và cần tốn rất nhiều công sức mới có thể sử dụng được. Đôi khi, lượng thông tin rất nhỏ rút ra được từ lượng dữ liệu cực lớn đó không đáng với thời gian, công sức và tiền bạc bỏ ra.

Theo báo cáo của Forrester, ít nhất 60% lượng dữ liệu của các tập đoàn không được sử dụng đến.

Tại sao không sử dụng chi phí lưu trữ những dữ liệu này để đầu tư vào cơ sở hạ tầng cho những dữ liệu thật sự hữu dụng?

Thời mà chúng ta tìm càng nhiều dữ liệu càng tốt cho AI đã qua. Mọi người phải nhận ra rằng, không phải tất cả các đặc điểm đều hữu ích (thậm chí còn gây hại) và chất lượng của dữ liệu quan trọng hơn là số lượng. Chúng ta cần những dữ liệu đo lường những thông tin có giá trị, một cách nhất quán và đáng tin cậy.  Bằng cách kiểm soát chất lượng của dữ liệu, chúng ta cũng đảm bảo một thời kỳ mà AI trở nên an toàn hơn.

Kỷ nguyên của việc triển khai và cơ sở hạ tầng tốt hơn.

Một khi đã có dữ liệu, chúng ta cần cơ sở hạ tầng để có thể sử dụng an toàn, chia sẻ, phân tích và tạo ra sự khác biệt giữa những dữ liệu vô dụng và những thông tin có giá trị. Chúng ta cũng cần phải xác định rằng AI là dành cho cả thế giới cùng sử dụng và hiểu được bằng cách đảm bảo cả chất lượng và độ tin cậy. Cần có nhiều người hiểu được rằn dữ liệu (như rất nhiều thứ khác) không nhất thiết phải lớn, tuy nhiên cần phải đáng tin cậy.

Tạm biệt Big Data, chào đón Reliable Data!

Nguồn: https://towardsdatascience.com/bye-bye-big-data-fbea187c7739

Posted on Leave a comment

Tổng hợp một số nền tảng thực hành SQL Online

SQL và sự cần thiết của nó với các bạn muốn làm chuyên sâu trong mảng dữ liệu là không thể bàn cãi.
Hiện có khá nhiều bạn đã từng học các khóa SQL nhưng chưa có cơ hội thực hành. Datapot tổng hợp lại các nguồn thực hành SQL online để các bạn có thể thực hành trực tiếp mà không phải cài đặt. Cực kỳ tiện lợi.

1. W3 school


Link: https://www.w3resource.com/sql-exercises/
Phiên bản SQL: PostgreSQL 9.4
Mô tả nhanh: Đầy đủ các câu lệnh cơ bản. Mô tả db rõ ràng. Giao diện dễ sử dụng. không cần đăng nhập.

2. PostgreSQL Exercises

Link: https://pgexercises.com/questions/basic/
Phiên bản SQL: PostgreSQL
Mô tả nhanh: Đầy đủ câu lệnh cơ bản, giao diện cực kỳ thân thiện, không cần đăng nhập. Các câu lệnh chia thành từng chủ đề rất dễ theo dõi.

3. Oracle Live

Link: https://livesql.oracle.com/
Phiên bản SQL: Oracle SQL (PL-SQL)
Mô tả nhanh: Giao diện cực kỳ khoa học, cho phép lựa chọn nhiều schema khác nhau, cung cấp công cụ để tạo lập vào follow các tutorial được thiết kế trước, quản lý session thông minh, lưu lại và theo dõi lịch sử học. Cần phải tạo một acc Oracle mới có thể đăng nhập và sử dụng được.

Posted on Leave a comment

T – Shape Model và câu chuyện học về ngành dữ liệu

T model of knowledge là gì?

Khi đọc những thông tin tuyển dụng hiện nay, bạn sẽ thấy ứng viên lý tưởng mà các công ty tìm kiếm thường là người có chuyên môn đủ sâu ở 1 mảng, nhưng cũng có kiến thức đủ rộng để bao quát công việc, có thể áp dụng linh hoạt ở nhiều mảng khác nhau.

T-model hay T-shaped skills là mô hình mô tả mức độ chuyên sâu về một kĩ năng cụ thể (Deep Expertise) và kiến thức nền tảng rộng ở nhiều mảng khác nhau (Wide Knowledge Base) của một người.

Các kiến thức và kĩ năng có thể thay đổi phụ thuộc vào đặc thù công việc. Tuy nhiên, có kiến thức nền tảng rộng và ít nhất một chuyên môn sâu là điều bắt buộc. Ở dưới là một skills set gợi ý cho một BI Analyst.

Wide Knowledge BaseChiều rộng

Dựa trên kinh nghiệm làm việc, mình gợi ý những kiến thức nền tảng cần cho một BI Analyst (Chuyên viên Phân tích kinh doanh) như sau: Kiến thức về toán (Xác suất & Thống kê), Lập trình, Truy vấn và làm sạch dữ liệu, Trực quan hóa dữ liệu, Giao tiếp & Thuyết trình, Kiến thức về lĩnh vực (Ví dụ như tài chính, logistic, marketing,…), Làm việc nhóm và Quản lí công việc.

Và điều quan trọng không đơn giản chỉ là học, tích lũy những phần kiến thức đó, mà còn là ứng dụng vào công việc như thế nào. Ví dụ như với kiến thức về trực quan hóa dữ liệu, bạn cần phải áp dụng được để tạo ra các dashboard hay báo cáo.

Deep Expertise – Chiều sâu

Bên cạnh phát triển chiều rộng, bạn cũng cần lựa chọn một mảng công việc để phát triển chuyên môn sâu hơn, tạo ra lợi thế cạnh tranh cho công việc cho mình. Và theo ví dụ dưới đây, thì mảng được lựa chọn là Data Visualization, kỹ năng làm báo cáo. Tuy nhiên, với mục tiêu, khả năng cũng như đặc thù công việc của mỗi người, thì sẽ có những sự lựa chọn khác nhau.

Đây chính là mô hình các bạn có thể tham khảo khi muốn gia nhập vào ngành dữ liệu, tuy nhiên nên học gì trước, học gì sau? Và nên lựa chọn Deep Expertise như thế nào?

Áp dụng T model vào việc học về ngành dữ liệu

Đầu tiên, hãy xác định rõ xuất phát điểm của mình, bạn đang có Base Knowledge hoặc Deep Expertise ở mảng nào, hoặc gần nhất với mảng nào.

Hãy coi Data Analystics như một kĩ năng, có nhiều trình độ khác nhau, nhiều môi trường khác nhau. Cũng giống như nấu ăn, tiêu chuẩn nấu ăn của một bà mẹ nấu ăn trong gia đình khác với một đầu bếp nhà hàng chuyên nghiệp. Mình thấy rất nhiều bạn đang làm từ rủi ro, tài chính, kế hoạch, kế toán… (đã có domain knowledge) đang chuyển hướng dần sang Data Analytics và biến Data Analytics trở thành kĩ năng chính. Giống như khi các công cụ dần trở nên phổ biến và dễ tiếp cận, một bà mẹ với đầy đủ công cụ và lợi thế hiểu rõ sở thích của từng thành viên trong gia đình hoàn toàn có thể làm bữa ăn ngon miệng hơn nhà hàng.

Chính vì vậy, sau khi xác định rõ xuất phát điểm, hãy xác đinh mục tiêu của mình theo 2 trường hợp sau:

A. Muốn có kĩ năng phân tích dữ liệu phục vụ cho công việc hiện tại

Bạn hãy tập trung vào những kĩ năng cải thiện công việc hiện tại. VD: Học SQL để lấy dữ liệu trực tiếp từ CSDL thay vì phải nhờ Dev hay IT, Power Query để tổng hợp dữ liệu tự động, lập trình để tự động hóa công việc. Dùng Power BI để tự động hóa hệ thống báo cáo về bán hàng, marketing,.

B. Bạn muốn chuyển ngành hay bắt đầu công việc như một Data Analyst:

Thay vì bắt đầu vào học ngay, bạn cần tìm hiểu về ngành sau đó xây dựng lộ trình phù hợp để có được những kiến thức nền mong muốn và xác định chuyên môn sâu để theo đuổi sau này.

Không lộ trình học nào là hoàn hảo, mà sẽ tùy vào mục tiêu, khả năng, kinh nghiệm hiện tại của mỗi người. Tuy nhiên, với ngành dữ liệu, cụ thể là vị trí BI hay Data Analyst trong doanh nghiệp, sẽ có những mảng kiến thức có thể nhanh chóng áp dụng vào công việc cho người mới bắt đầu. Đấy là những mảng bạn có thể cân nhắc học trước, cụ thể thì Datapot sẽ chia sẻ trong bài viết sắp tới.

Theo dõi Fanpage Facebook của Datapot để không bỏ lỡ các bài viết tiếp theo.

Để được trao đổi, hỏi đáp về chuyên môn và cơ hội nghề nghiệp ngành dữ liệu, hãy tham gia Group Data Analytics and Business Intelligence Vietnam.