Posted on Leave a comment

Hãy chọn Chart đúng (Phần 1)

Tại sao cần chọn Chart đúng?

Trong hoạt động kinh doanh ngày càng phức tạp và đa dạng hiện nay, các doanh nghiệp thường đòi hỏi ở nhân viên của mình khả năng đưa ra quyết định đúng dựa trên dữ liệu. Tuy nhiên để đưa ra được quyết định dựa trên dữ liệu, trước tiên chúng ta phải lấy được thông tin có giá trị từ đống data “thập cẩm” mà hệ thống thu thập được.

Và để những số liệu và tính toán khô khan kể ra câu chuyện của nó là cả một nghệ thuật – nghệ thuật trực quan hóa dữ liệu. Trong 1 biển dữ liệu được thu thập, để lấy được những thông tin, sự thật có giá trị, công việc của bạn không chỉ là tách thông tin nhiễu khỏi dữ liệu mà còn thể hiện phải nó đúng cách.

Hướng dẫn cơ bản về chọn Chart

Trong bài này mình sẽ chia sẻ với các bạn làm sao để có thể chọn đúng cách trực quan hoá dữ liệu.

Có bốn cách cơ bản mà bạn có thể sử dụng để trình bày dữ liệu của mình:
• So sánh
• Mối quan hệ
• Phân phối
• Tỉ trọng thành phần

Trừ khi bạn là nhà thống kê hoặc nhà phân tích dữ liệu, rất có thể bạn chỉ sử dụng hai loại phân tích dữ liệu được sử dụng phổ biến nhất: So sánh hoặc tỉ trọng thành phần. Để xác định biểu đồ nào phù hợp nhất, trước tiên bạn phải trả lời một vài câu hỏi sau:

• Bạn muốn hiển thị bao nhiêu biến trong một biểu đồ? Một, hai, ba, nhiều?
• Có bao nhiêu mục (điểm dữ liệu) bạn sẽ hiển thị cho mỗi biến? Chỉ một vài hay nhiều?
• Bạn sẽ hiển thị các giá trị trong một khoảng thời gian, hoặc giữa các nhóm?

Biểu đồ cột (Bar chart) phù hợp nhất để so sánh, trong khi biểu đồ đường (Line chart) thể hiện xu hướng hiệu quả nhất. Biểu đồ phân tán (Scatter plot) thể hiện tốt nhất các mối quan hệ và phân phối, trong khi biểu đồ tròn (Pie chart) chỉ nên được sử dụng để thể hiện các tỉ trọng thành phần đơn giản và không bao giờ dùng để so sánh hoặc thể hiện phân phối.
Sơ đồ hướng dẫn lựa chọn biểu đồ trong hình ở đầu bài theo mình sẽ là công cụ giúp mọi người chọn được biểu đồ thích hợp hiệu quả và nhanh chóng. Tuy nhiên để thể hiện tối ưu 1 loại biểu đồ khi đã chọn được loại biểu đồ phù hợp, chúng ta vẫn cần nắm được 1 số tips khác. Trong bài này mình sẽ chia sẻ 1 số tips để thể hiện biểu đồ đường hiệu quả

Biểu đồ đường

Biểu đồ đường là một trong những loại biểu đồ được sử dụng thường xuyên nhất. Chúng phù hợp nhất cho việc trực quan hóa dữ liệu theo xu hướng trong một khoảng thời gian, khi số lượng điểm dữ liệu rất cao (lớn hơn 20).
Với biểu đồ đường, sự nhấn mạnh là sự tiếp tục hoặc dòng chảy của các giá trị (xu hướng), nhưng vẫn có một số hỗ trợ cho so sánh giá trị đơn, sử dụng các dấu dữ liệu (chỉ có ít hơn 20 điểm dữ liệu.)
Biểu đồ đường cũng là một thay thế tốt cho biểu đồ cột khi kích cỡ thể hiện của biểu đồ nhỏ .

Biểu đồ dòng thời gian

Biểu đồ dòng thời gian là một biến thể của biểu đồ đường. Rõ ràng, bất kỳ biểu đồ đường nào hiển thị giá trị trong một khoảng thời gian đều được coi là biểu đồ dòng thời gian. Sự khác biệt duy nhất ở đây là về chức năng – hầu hết các biểu đồ dòng thời gian sẽ cho phép bạn phóng to và thu nhỏ, nén hay kéo dài trục thời gian để xem thêm chi tiết hoặc xu hướng chung.
Các ví dụ phổ biến nhất của biểu đồ dòng thời gian có thể là:
• Giá thị trường chứng khoán thay đổi theo thời gian
• Khách truy cập trang web mỗi ngày trong 30 ngày qua
• Số lượng bán hàng theo ngày trong quý trước

Dos và Don’t khi sử dụng biểu đồ đường

• Sử dụng các đường để trình bày dữ liệu liên tục trong một thang đo khoảng, trong đó các khoảng có kích thước bằng nhau.
• Đối với biểu đồ đường, trục có thể không bắt đầu từ 0 nếu thông điệp dự định của biểu đồ là tốc độ thay đổi hoặc xu hướng chung, không phải là giá trị chính xác hoặc giá trị so sánh. Tốt nhất là bắt đầu trục với số 0 vì một số người có thể giải thích biểu đồ không chính xác.
• Trong biểu đồ đường, thời gian phải luôn luôn chạy từ trái sang phải.
• Đừng bỏ qua các giá trị để đảm bảo tính chính xác và nhất quán của việc trình bày thông tin xu hướng, ví dụ: một số ngày nhất định có giá trị bằng không.
• Tối giản trong trình bày biểu đồ (loại bỏ hiệu ứng, đường guideline…) để nhấn mạnh xu hướng, tốc độ thay đổi và để giảm sự phân tâm.
• Sử dụng tỷ lệ khung hình phù hợp để hiển thị thông tin quan trọng và tránh các hiệu ứng dốc đáng kể. Để có nhận thức tốt nhất, hãy nhắm đến độ dốc 45 độ. (https://eagereyes.org/basics/banking-45-degrees)

Kết luận

Tóm lại, khi làm việc với dữ liệu, mỗi chúng ta hãy nhớ đến flow sau:
Data -> Knowledge -> Action -> Wisdom


Để ra được action đúng và sau đó đúc rút thành kinh nghiệm, tri thức đúng đắn thì chúng ta phải chọn cách thể hiện dữ liệu chính xác. Trong các bài chia sẻ tiếp theo mình sẽ chia sẻ tiếp best practices của các loại biểu đồ khác.

Để được trao đổi, hỏi đáp về chuyên môn và cơ hội nghề nghiệp ngành dữ liệu, hãy tham gia Group Data Analytics and Business Intelligence Vietnam.

Theo dõi Livestream Chia sẻ câu chuyện ngành dữ liệu và lắng nghe chia sẻ từ chuyên gia trong ngành.

Theo dõi Fanpage Facebook của Datapot để không bỏ lỡ các bài viết tiếp theo.

Leave a Reply

Your email address will not be published. Required fields are marked *