Bài 5. Phân tích hiệp phương sai đa biến một chiều (One-way MANCOVA)
1. MANCOVA một chiều là gì?
MANCOVA là viết tắt của Multivariate Analysis of Covariance – phân tích hiệp phương sai đa biến một chiều. MANCOVA có thể được coi là phần mở rộng của MANOVA một chiều để kết hợp một hiệp biến hoặc phần mở rộng của ANCOVA một chiều để kết hợp nhiều biến phụ thuộc. Hiệp biến có liên quan tuyến tính với các biến phụ thuộc và việc đưa nó vào phân tích có thể làm tăng khả năng phát hiện sự khác biệt giữa các nhóm của một biến độc lập. MANCOVA một chiều được sử dụng để xác định liệu có bất kỳ sự khác biệt có ý nghĩa thống kê nào giữa các trung bình được điều chỉnh của ba hoặc nhiều nhóm độc lập (không liên quan), có kiểm soát cho một hiệp biến liên tục.
Ví dụ: bạn có thể sử dụng MANCOVA một chiều để xác định xem một số thành tích thi khác nhau có khác nhau hay không dựa trên mức độ lo lắng trong bài kiểm tra giữa các học sinh, đồng thời kiểm soát thời gian ôn tập (tức là, các biến phụ thuộc của bạn sẽ là “thành tích thi toán”, “thành tích thi văn” và “thành tích thi tiếng anh”, biến độc lập của bạn sẽ là “mức độ lo lắng khi thi”, có ba nhóm “học sinh lo lắng thấp”,” học sinh lo lắng vừa phải” và “học sinh lo lắng cao”- và hiệp biến của bạn sẽ là “thời gian ôn tập”, tính bằng giờ). Bạn muốn kiểm soát thời gian ôn tập vì bạn tin rằng ảnh hưởng của mức độ lo lắng trong bài kiểm tra đối với kết quả thi tổng thể ở một mức độ nào đó sẽ phụ thuộc vào lượng thời gian học sinh dành cho việc ôn tập.
MANCOVA một chiều rất hữu ích, nhưng điều quan trọng là phải nhận ra rằng MANCOVA một chiều sẽ cho bạn biết liệu các nhóm của biến độc lập có khác biệt đáng kể về mặt thống kê hay không dựa trên các biến phụ thuộc được kết hợp, sau khi điều chỉnh cho hiệp biến, nhưng nó sẽ không giải thích thêm về kết quả. Nói cách khác, MANCOVA một chiều sẽ không cho bạn biết về sự khác biệt giữa các nhóm cụ thể. Sử dụng ví dụ trên, MANCOVA một chiều có ý nghĩa thống kê sẽ chỉ ra rằng có sự khác biệt về mức độ lo lắng khi thi trên điểm tổng hợp của ba kỳ thi (toán, văn, và Anh). Tuy nhiên, nó sẽ không cho biết liệu học sinh lo âu thấp đạt điểm cao hơn trong điểm thi tổng hợp so với học sinh căng lo âu cao hơn, hoặc thậm chí cụ thể hơn, liệu học sinh lo âu thấp có đạt điểm cao hơn trong một kỳ thi cụ thể (ví dụ: kỳ thi toán) so với học sinh lo âu cao. Do đó, các bài kiểm tra Post Hoc có thể được sử dụng để xác định đâu là sự khác biệt giữa các nhóm.
2. Giả định kiểm tra
Kiểm tra MANCOVA một chiều có thể được sử dụng khi đáp ứng các giả định sau:
- Giả định 1: Hai hoặc nhiều biến phụ thuộc của bạn phải được đo lường ở thang khoảng hoặc mức tỷ lệ (tức là chúng liên tục). Ví dụ về các biến đáp ứng tiêu chí này bao gồm thời gian ôn tập (đo bằng giờ), trí thông minh (đo bằng điểm IQ), thành tích thi (đo từ 0 đến 100), cân nặng (đo bằng kg), v.v.
- Giả định 2: Một biến độc lập phải bao gồm hai hoặc nhiều nhóm phân loại, nhóm độc lập. Ví dụ các biến độc lập đáp ứng tiêu chí này bao gồm giới tính (nam và nữ), các mức độ hoạt động thể chất (với 4 nhóm: ít vận động, thấp, trung bình và cao), ngành học (với 4 nhóm: kỹ thuật, kinh tế, ngoại ngữ, sư phạm), v.v.
- Giả định 3: Một hoặc nhiều hiệp biến của bạn đều là các biến liên tục. Hiệp biến đơn giản là một biến độc lập liên tục được thêm vào mô hình MANOVA để tạo ra mô hình MANCOVA. Hiệp biến này được sử dụng để điều chỉnh phương tiện của các nhóm của biến độc lập phân loại. Trong MANCOVA, hiệp biến thường chỉ ở đó để cung cấp đánh giá tốt hơn về sự khác biệt giữa các nhóm của biến độc lập phân loại trên các biến phụ thuộc.
- Giả định 4: Bạn nên có sự độc lập với các quan sát, có nghĩa là không có mối quan hệ nào giữa các quan sát trong mỗi nhóm hoặc giữa các nhóm với nhau. Tức là không có người tham gia nào ở nhiều hơn một nhóm. Đây là một vấn đề thiết kế nghiên cứu, thay vì một cái gì đó bạn có thể kiểm tra, nhưng nó là một giả định quan trọng của MANCOVA một chiều.
- Giả định 5: Cần có mối quan hệ tuyến tính giữa từng cặp biến phụ thuộc trong mỗi nhóm của biến độc lập. Nếu các biến không liên quan tuyến tính, sức mạnh của phép thử sẽ bị giảm. Bạn có thể kiểm tra giả định này bằng cách vẽ một đồ thị ma trận phân tán của các biến phụ thuộc cho mỗi nhóm của biến độc lập.
- Giả định 6: Cần có một mối quan hệ tuyến tính giữa hiệp biến và mỗi biến phụ thuộc trong mỗi nhóm của biến độc lập. Tương tự như Giả thiết số 5 ở trên, bạn có thể kiểm tra giả định này bằng cách vẽ một đồ thị ma trận phân tán của hiệp biến cho mỗi biến phụ thuộc, cho mỗi nhóm của biến độc lập.
- Giả định 7: Cần có sự đồng nhất của các độ dốc hồi quy. Giả định này nói rằng mối quan hệ giữa hiệp biến và mỗi biến phụ thuộc, được đánh giá bằng độ dốc hồi quy, là như nhau trong mỗi nhóm của biến độc lập.
- Giả định 8: Cần có sự đồng nhất của các phương sai và hiệp phương sai. Nói cách khác, MANCOVA một chiều giả định rằng phương sai và hiệp phương sai của các biến phụ thuộc là bằng nhau trong tất cả các nhóm của biến độc lập. Bạn có thể kiểm tra giả định này bằng cách sử dụng Box’s M Test of Equality of Covarices Matrices.
- Giả định 9: Không được có các ‘ngoại lệ đơn biến’ (univariate outlier) đáng kể trong các nhóm của biến độc lập về từng biến phụ thuộc. Nếu có bất kỳ điểm số biến phụ thuộc nào khác thường trong bất kỳ nhóm nào của biến độc lập, trong đó giá trị của chúng là cực trị nhỏ hoặc lớn so với các điểm số khác, thì những điểm số này được gọi là giá trị ngoại biến đơn biến. Các giá trị ngoại lệ đơn biến có thể có tác động tiêu cực lớn đến kết quả vì chúng có thể gây ảnh hưởng lớn đến giá trị trung bình của nhóm đó, điều này có thể ảnh hưởng đến kết quả kiểm tra thống kê. Các giá trị ngoại lệ đơn biến là quan trọng hơn để xem xét khi bạn có cỡ mẫu nhỏ hơn, vì ảnh hưởng của giá trị ngoại lệ sẽ lớn hơn. Các ngoại lệ đơn biến có thể được phát hiện bằng cách kiểm tra các phần dư chuẩn hóa.
- Giả định 10: Không được có các ‘ngoại lệ đa biến’ (multivariate outlier) đáng kể trong các nhóm của biến độc lập về từng biến phụ thuộc. Các ngoại lệ đa biến là các trường hợp có sự kết hợp bất thường của điểm số trên các biến phụ thuộc trong mỗi nhóm của biến độc lập. SPSS có thể tính toán một thước đo được gọi là khoảng cách Mahalanobis (Mahalanobis distance), có thể được sử dụng để xác định xem một trường hợp cụ thể có thể là một ngoại lệ đa biến hay không.
- Giả định 11: Cần có ‘tính chuẩn đa biến’ (multivariate normality). Thật không may, tính chuẩn đa biến là một giả định đặc biệt khó kiểm tra và không thể kiểm tra trực tiếp trong SPSS. Thay vào đó, tính chuẩn của từng phần dư cho mỗi nhóm của biến độc lập thường được sử dụng thay thế cho nó như một ‘phỏng đoán’ tốt nhất về việc liệu có tính chuẩn đa biến hay không. Bạn có thể kiểm tra điều này bằng cách sử dụng thử nghiệm Kolmogorov-Smirnov và Shapiro-Wilk hoặc vẽ đồ thị phân tán.
Bạn có thể kiểm tra các giả định 5, 6, 7, 8, 9, 10 và 11 bằng cách sử dụng Thống kê SPSS. Trước khi thực hiện việc này, bạn nên đảm bảo rằng dữ liệu của mình đáp ứng các giả định 1, 2, 3 và 4. Nếu bạn không chạy các bài kiểm tra thống kê trên các giả định này một cách chính xác, kết quả bạn nhận được khi chạy MANCOVA một chiều có thể không hợp lệ.




















