Hướng dẫn sử dụng Tableau cấp tốc trong 1 ngày

Tableau là một trong các công cụ phân tích và trực quan hóa dữ liệu tốt nhất hiện nay. Nhằm giúp đỡ mọi người trong việc tự học Tableau một cách đơn giản, hiệu quả và nhanh nhất, bài viết này SmartData sẽ giúp các bạn tổng hợp kiến thức về Tableau – cụ thể là Tableau Desktop để có thể học và hiểu cấp tốc trong 1 ngày.

Các thành phần của Tableau Desktop

1. Data

Nơi chứa thông tin về dữ liệu đầu vào gồm có:

  • Data Source: Nơi định nghĩa các dữ liệu đầu vào được sử dụng để thiết kế các báo cáo trong Tableau
  • Dimension: Biến phân loại: Dimensions chứa giá trị định tính như tên, ngày tháng, dữ liệu địa lý.
    Có thể sử dụng dimensions để phân loại, phân chia và tiết lộ chi tiết về dữ liệu. Dimensions sẽ ảnh hưởng đến mức độ chi tiết bên trong view. Biến phân loại là các nhãn phân tách các giá trị định lượng thành các nhóm với những nhãn có ý nghĩa nhỏ hơn.
    Biến phân loại được chia thành các loại nhỏ:

    • Định danh (nominal): Các đối tượng riêng lẻ khác nhau về tên gọi. Các đối tượng này không có trật tự đặc biệt nào và không có giá trị định lượng.
    • Thứ bậc (ordinal): Các đối tượng riêng lẻ khác nhau, được sắp xếp theo thứ tự nhất định và không có giá trị định lượng.
    • Các đối tượng riêng lẻ tương ứng với các giá trị định lượng. Các khoảng bắt đầu như một dải các giá trị định lượng được chuyển đổi thành thang phân loại bằng cách chia giá trị thành các đoạn nhỏ có kích thước bằng nhau, mỗi giá trị được gán cho một nhãn (ví dụ “0–99” hoặc “> = 0 và < 100”).
    • Thời gian: Đây là một thang phân loại khá đặc biệt vì nó vừa có thể được coi như thang đo khoảng hoặc thang đo thứ bậc.
  • Measure: Biến định lượng: Measures chứa các con số, giá trị định tính mà bạn có thể đo. Measures có thể được tổng hợp, khi bạn kéo một measure vào view, Tableau sẽ áp dụng một tổng hợp cho nó theo mặc định. Biến định lượng chứa các giá trị là các con số, các phép đo phản ánh dữ liệu liên quan đến doanh nghiệp như số lượng đơn hàng, lợi nhuận, mức độ hài lòng của khách hàng… Các giá trị định lượng được biểu diễn dưới dạng con số và có thể thực hiện được các phép toán số học giữa các số này.
    Có hai loại gia trị định lượng:

    • Giá trị rời rạc (Discrete): Giá trị được biểu thị bởi các số nguyên, có thể đếm được như số sản phẩm bán ra, số ngày trong năm…
    • Giá trị liên tục (Continuous): Biến mà các giá trị có thể có của nó được lấp kín cả một khoảng trên trục số. Ví dụ như giá bán sản phẩm, doanh thu, lợi nhuận…
  • Set: Các tập dữ liệu được định nghĩa trong Data Source
  • Parameter: Các tham số được định nghĩa trong Workbook

2. Analytics

Chứa các phân tích nâng cao gồm có:

  • Summarize
  • Constant Line
  • Average Line
  • Median with Quartiles
  • Box Plot
  • Totals
  • Model
  • Average with 95% CI
  • Median with 95% CI
  • Trend Line
  • Forecast
  • Cluster
  • Custom
  • Reference Line
  • Reference Band
  • Distribution Band
  • Box Plot

3. Worksheet

Trang thiết kế một báo cáo trong Tableau.

4. Workbook

Một tệp tin chứa một hoặc nhiều Worksheet, Dashboard và Story trong Tableau.

5. Dashboard

Thể hiện một khung nhìn chứa một hoặc nhiều Worksheet

6. Story

Thể hiển một thứ tự các Worksheet và Dashboard.

7. Show me

Giúp chuyển đổi giữa các dạng biểu đồ một cách nhanh chóng

Các loại dữ liệu trong Tableau Desktop

Loại dữ liệu Mô tả
Numberic(decimal) Dữ liệu kiểu số có chứa phần thập phân
Numberic(whole) Dữ liệu kiểu số không chưa phần thập phân
String Dữ liêu kiểu chuỗi
Boolean Dữ liệu kiểu logic
Date Dữ liệu kiểu ngày tháng năm
Date & Time Dữ liệu kiểu ngày tháng năm + giờ phút giây

Bảng các loại dữ liệu trong Tableau Desktop

Các dạng biểu đồ trong Tableau

1. Text Tables

Text tables dùng để hiển thị một bảng dữ liệu (dạng như crosstab hoặc pivot).

Ví dụ: Hiển thị doanh thu theo từng vùng

Text Table

2. Heat Maps

Heat maps (bản đồ nhiệt) là một biểu đồ gồm hai chiều trong đó các giá trị được thể hiện bằng màu sắc. Nó như một bảng tóm tắt các thông tin giúp người dùng nắm bắt thông tin một cách nhanh chóng

Ví dụ: Hiển thị dữ liệu Doanh thu (Sales) và Lợi nhuận (Profit) của dòng sản phẩm (Category) và vùng (Region)

Heat Map

3. Highlight Tables

Highlight Tables là một dạng giống với Heat Maps dùng để hiển thị dữ liệu qua màu sắc nhưng Highlight tables hiển thị dữ liệu chi tiết thay vì hiển thị hình chữ nhật như Heat maps.

Ví dụ: Hiển thị dữ liệu Doanh thu (Sales) và Lợi nhuận (Profit) của dòng sản phẩm (Category) và vùng (Region).

Highlight Table

4. Symbol Maps

Symbol Maps cho phép hiển thị dữ liệu lên bản đồ địa lí theo quốc gia, vùng, tỉnh, quận/huyện dưới dạng Marker (điểm).

Ví dụ: Hiển thị dữ liệu doanh thu (Sales) theo từng thành phố (city).

Symbol Map

5. Maps

Maps cho phép hiển thị dữ liệu lên bản đồ địa lí theo quốc gia, vùng, tỉnh, quận/huyện dưới dạng phủ màu lên toàn vùng đó.

Ví dụ: Hiển thị dữ liệu doanh thu (Sales) theo từng bang (State).

Map

6. Pie Charts

Là một dạng biểu hình tròn bao gồm nhiều phần. Pie charts thường dùng để thể hiện tỷ trọng đóng góp (%) của các đối tượng con vào số tổng.

Ví dụ: Hiển thị tỉ trọng doanh thu (Sales) theo từng bộ phận (Segment)

Pie Chart

7. Horizontal Bars

Horizontal Bars là một dạng biểu đồ hình cột quen thuộc, dạng này được dùng để so sánh các đối tượng dữ liệu với nhau.

Ví dụ: Biểu đồ hiển thị so sánh doanh thu (Sales) giữa các bộ phận (Segment)

Horizontal Bar

8. Stacked Bars

Stacked bars là một dạng biểu đồ hình cột như Horizontal bars nhưng mỗi cột nó có nhiều phần xếp lên nhau, vì vậy ngoài việc có thể so sánh dữ liệu các cột với nhau, bạn còn thể hiển thị thêm một chiều thể hiện chi tiết thành phần của mỗi cột.

Ví dụ: Biểu đồ thể hiện doanh thu (Sales) và số lượng (Quantity) theo từng bộ phận (Segment) và từng loại sản phẩm (Category).

Stacked Bar

9. Side-by-side Bars

Side – by – side bars là một dạng biểu đồ hình cột để so sánh nhiều đối tượng dữ liệu trên một không gian làm việc.

Ví dụ: So sánh doanh thu (Sales) và số lượng (Quantity) theo từng bộ phận (Segment), từng loại sản phẩm (Category).

Side by Side Bar

10. Treemaps

Treemaps là một dạng biểu đồ biểu diễn dữ liệu thành các hình chữ nhật, kích thước của mỗi hình chữ nhật thể hiện độ lớn của đối tượng. Bạn có rất nhiều đối tượng dữ liệu vậy bạn muốn xem những đối tượng nào đang chiếm tỉ trọng cao, dùng Treemaps để xem điều này.

Ví dụ: Hiển thị tỉ trọng doanh thu (Sales) theo từng bộ phận (Segment) và theo từng loại sản phẩm (Category).

Treemap

11. Circle Views

Circle views là một dạng biểu đồ bao gồm nhiều hình tròn thể hiện độ phân tán dữ liệu của bạn.

Ví dụ: Hiển thị mức độ phân tán doanh thu (Sales) theo từng bộ phận (Segment) và loại sản phẩm (Category).

Circle View

12. Side-by-side Circles

Side – by – side circle tương tự như Circle views, nhưng nó cung cấp cho bạn một cách nhìn khác.

Ví dụ: Hiển thị mức độ phân tán doanh thu (Sales) theo từng bộ phận (Segment) và loại sản phẩm (Category).

Side by Side Circle

13. Lines (Continuous)

Chart cho phép nhìn thấy dòng chảy của dữ liệu theo dòng thời gian.

Ví dụ: Hiển thị sự biến động doanh thu (Sales) và số lượng (Quantity) theo ngày (Order Date).

Line Chart

14. Dual Lines

Thể hiện sự biến động dữ liệu của 2 measures theo thời gian, so sánh hai giá trị với nhau.

Ví dụ: Xây dựng biểu đồ thể hiện sự biến động của giá trị profit và sales qua các năm.

Dual Line

15. Area Charts (Continuous)

Biểu đồ phân vùng cho từng nhóm để thấy sự chênh lệch giữa các nhóm.

Ví dụ: Xây dựng biểu đồ phân khác thị trường theo dòng thời gian của profit và sales.

Area Chart Continuos

16. Area Charts (Discrete)

Biểu đồ phân vùng cho từng nhóm để thấy sự chênh lệch giữa các nhóm.

Ví dụ: Xây dựng biểu đồ phân khác thị trường theo dòng thời gian của profit và sales.

Area Chart Discrete

17. Dual combination

Biểu đồ thể hiện một dạng khác của Dual Charts, so sánh 2 giá trị measures.

Ví dụ: Xây dựng biểu đồ thể hiện sự biến động của giá trị profit và sales qua các năm.

Dual Combination

18. Scatter Plots

Cho thấy được mức độ tương quan của các measures chi tiết theo (nhóm sản phẩm, sản phẩm, khách hàng, phân khúc thị trường…).

Ví dụ: Xây dựng biểu đồ tương quan giữa Doanh thu (Sales), Lợi nhuận (Profit) theo từng bộ phận (Segment) và Khách hàng (Customer Name).

Scatter Plot

19. Histogram

Biểu đồ có thể thống kê tổng giá trị trong một khoảng giá trị để thấy được mức độ tập hợp ở khoảng nào.

Ví dụ: Xây dựng biểu đồ thống kê hiển thị số lượng đơn hàng (Quantity).

Histogram

20. Box-and-whisker Plots

Biểu đồ cho phép xem được sự phân tán và tập trung dữ liệu theo từng nhóm.

Ví dụ: Xây dựng biểu đồ xem giá ở mức nào của từng nhóm sản phẩm là bán chạy, tập trung cao nhất.

Dựa trên biểu đồ sẽ tại các Box Plot là nơi tập trung 50 % của các điểm dữ liệu.

Box and Whisker Plot

21. Gantt Chart

Biểu đồ Gantt dùng để để hiển thị thời gian của các sự kiện hoặc hoạt động theo thời gian. Trong một biểu đồ Gantt bar, từng nhãn hiệu riêng biệt (thường là một thanh) cho thấy một thời gian khác nhau.

Ví dụ: Xây dựng biểu đồ Gantt để hiển thị thời gian giao hàng trung bình cho một phạm vi của sản phẩm.

Để tạo một biểu đồ Gantt cho biết bao nhiêu ngày, trung bình, trôi qua giữa order date và ship date, làm theo các bước dưới đây. Các dữ liệu được chia ra theo sub_category và ship mode. Các view hiển thị kết quả trên một cơ sở hàng tuần cho một kỳ 3 tháng.

Gantt Chart

22. Bullet Graphs

Biểu đồ cho thấy được sự tương quan của 2 giá trị, ví dụ như tương quan giữa số thực tế và số kế hoạch, chúng ta có thể xem được số thực tế đã đạt được bao nhiêu phần trăm số kế hoạch.

Ví dụ: Xây dựng biểu đồ Bullet để thể hiện doanh thu đạt được (Sales) so với mục tiêu (Target) theo từng loại sản phẩm (Category).

Bullet Graph

23. Packed Bubbles

Biểu đồ bong bóng cho phép bạn hiển thị dữ liệu trong một cụm các vòng tròn.

Sử dụng kích thước để xác định các bong bóng khác nhau dựa trên các giá trị measures và để xác định màu sắc của các vòng tròn cá nhân bằng dimensions.

Biểu đồ bong bóng cung cấp một hình dung dữ liệu tương đối đơn giản mà có thể cung cấp cái nhìn sâu sắc trong một định dạng trực quan hấp dẫn.

Ví dụ: Xây dựng biểu đồ bong bóng thể hiện doanh thu (Sales) theo từng loại sản phẩm (Category), nhóm sản phẩm (Sub-category) và sản phẩm (Product Name).

Packed Bubble

Nếu các bạn có nhu cầu muốn học Tableau một cách bài bản hơn nữa, có thể tham khảo các khóa học tableau ở đây.

Nguồn: https://truongxaydunghcm.edu.vn/