Ma trận Scatterplot (Scatterplot Matrix)
1. Giới thiệu
Nhiều phân tích tham số, chẳng hạn như phân tích tương quan Pearson, (phân tích hồi quy,…), chúng ta cần kiểm tra dữ liệu bằng đồ thị phân tán. Đồ thị phân tán có thể cung cấp các thông tin rất hữu ích về: i) phát hiện mối quan hệ tuyến tính giữa hai biến, ii) phát hiện các điểm ngoại lệ, iii) cung cấp một vài mô tả ban đầu về mối quan hệ hai biến. Tuy nhiên, khi bạn nhiều hơn 2 biến và muốn kiểm tra đồ thị phân tán của từng cặp biến với nhau, đó là khi bạn nên sử dụng Ma trận Scatterplot.
Ma trận đồ thị phân tán (Scatterplot Matrix) là một bảng gồm các đồ thị phân tán. Mỗi đồ thị phân tán của các cặp biến nhằm trong mỗi ô nhỏ để nhiều ô có thể nằm gọn trên một trang. Điều này vừa hiển thị trực quan, vừa tiết kiệm không gian bài viết khi tất cả các đồ thị phân tán được hiển thị trong một bảng duy nhất.
Chúng tôi khuyên bạn nên cài SPSS version 25 trở lên để được hỗ trợ tốt nhất công cụ vẽ biểu đồ, đồ thị.
2. Hướng dẫn tạo đồ thị ma trận phân tán trong SPSS
Ví dụ, một nhà nghiên cứu muốn kiểm tra mối liên hệ giữa các yếu tố trầm cảm, lo âu và stress trong sức khỏe tâm thần của các sinh viên. Họ lựa chọn ngẫu nhiên 10 sinh viên tham gia trả lời một phiếu bảng hỏi sử dụng thang đo DASS 21 của Lovibond. Trước khi tiến hành kiểm tra tương quan giữa ba yếu tố này, nhà nghiên cứu tiến hành kiểm tra biểu đồ phân tán giữa các cặp biến. Do số lượng biết nhiều hơn hai, nên nhà nghiên cứu quyết định sử dụng Ma trận đồ thị phân tán.
Bạn hãy thực hiện theo các bước sau đây để tạo một đồ thị Scatterplot Matrix trong SPSS:
– Bước 1: chọn Graphs > Chart Builder…
– Bước 2: Trong hộp thoại Chart Builder, chọn “Scatter/Dot” từ vùng Choose from, chín tùy chọn đồ thị phân tán khác nhau xuất hiện. Chúng ta chọn loại Scatterplot Matrix và chuyển nó vào vùng xem trước biểu đồ chính (Chart preview uses example data).
– Bước 3: Giữ phím CTRL, nhấp chọn ba biến ‘Trầm cảm’, ‘Lo âu’, và ‘Stress’ từ hộp Variables. Sau đó, kéo thả các biến này vào hộp “Scatterplot Matrix?”. Cuối cùng, nhấp OK để chạy kết quả.
– Bước 4: Trong cửa sổ Output hiển thị kết quả, chúng ta nhìn thấy một ma trận đồ thị hiển thị mối quan hệ giữa từng cặp biến. Để hiển thị rõ hơn một quan hệ hai biến, chúng ta làm như sau:
+ Click đúp vào hình vẽ ma trận đồ thị phân tán để mở cửa sổ ‘Chart Editor’.
+ Nhấp vào biểu tượng Add Fit Line at Total để hiển thị đường thẳng phù hợp giữa các cặp dữ liệu.
+ Nhấp vào Options, chọn Show Chart in the Diagonal để hiển thị biểu đồ thanh phân phối dữ liệu của từng biến.
+ Đóng cửa sổ ‘Chart Editor’ để thu được kết quả như hình dưới đây:
Phù! Thực sự rất đẹp.
Gợi ý nhận xét:
Ma trận đồ thị phân tán cho bạn thấy những cảm nhận ban đầu về mối quan hệ giữa cặp biến. Chúng ta có thể nhận thấy rõ một đường thẳng phù hợp xuyên qua đám mây các điểm dữ liệu biểu lộ một mối quan hệ tuyến tính. Các đường thẳng cho thấy mối quan hệ giữa các cặp biến là tương quan dương. Những cảm nhận này là cơ sở quan trọng để tiến hành bài kiểm tra tương quan Pearson.