Bài 4. Phân tích hiệp phương sai hai chiều (Two-way ANCOVA)
1. ANCOVA hai chiều là gì?
ANCOVA hai chiều (còn được gọi là “ANCOVA giai thừa” – factorial ANCOVA) được sử dụng để xác định liệu có hiệu ứng tương tác giữa hai biến độc lập về một biến phụ thuộc liên tục hay không (tức là nếu tồn tại một hiệu ứng tương tác hai chiều), sau khi điều chỉnh / kiểm soát (adjusting/controlling) một hoặc nhiều hiệp biến liên tục. ANCOVA hai chiều có thể được coi là phần mở rộng của ANCOVA một chiều, chỉ có một biến độc lập (thay vì hai biến độc lập) hoặc là phần mở rộng của ANOVA hai chiều để kết hợp một hoặc nhiều hiệp biến liên tục.
Ví dụ 1, một nhà nghiên cứu có thể sử dụng ANCOVA hai chiều để hiểu liệu thành tích thi Toán có khác nhau hay không dựa trên mức độ lo lắng trong bài kiểm tra giữa các sinh viên hay không. Họ cũng muốn hiểu cách các mức độ lo âu này được so sánh ở những thời gian ôn tập phân loại theo ‘ôn tập đều’ và ‘chỉ ôn tập khi sắp thi’. Do đó, trong nghiên cứu này, hai biến độc lập là “mức độ lo lắng khi kiểm tra” (có ba nhóm – “sinh viên lo âu thấp”, “sinh viên lo âu trung bình” và ” sinh viên lo âu cao”), và “thời điểm ôn tập” (với hai loại, “ôn tập đều” và “chỉ ôn tập khi sắp thi”), biến phụ thuộc là “thành tích thi toán” (đo từ 0-100 điểm) và hiệp biến liên tục là giờ ôn tập (tức là tổng số giờ ôn tập toán).
Các nhà nghiên cứu muốn biết: (a) liệu các mức độ lo lắng ảnh hưởng như thế nào đến thành tích thi toán của các sinh viên; và (b) liệu thành tích thi toán theo các nhóm mức độ lo âu khi kiểm tra có khác nhau hay không tùy thuộc vào thời lượng ôn tập được phân loại trong ‘ôn tập đều’ và ‘chỉ ôn tập khi sắp thi’. Hai mục tiêu này hoàn toàn điển hình của một phân tích ANCOVA hai chiều. Quan trọng là, mục tiêu thứ hai được giải đáp bằng cách xác định xem liệu có một hiệu ứng tương tác hai chiều có ý nghĩa thống kê hay không. Điều này thường được ưu tiên hàng đầu trong phân tích ANCOVA hai chiều vì kết quả của nó sẽ xác định xem mục tiêu đầu tiên của các nhà nghiên cứu có sai lệch hoặc không đầy đủ hay không. Giả sử rằng một tác dụng tương tác hai chiều có ý nghĩa thống kê được tìm thấy, điều này cho thấy rằng thành tích thi toán ở các mức độ lo âu khi kiểm tra là khác nhau ở những học sinh ‘ôn tập đều’ và ‘chỉ ôn tập khi sắp thi’, sau khi điều chỉnh / kiểm soát đối với thời lượng ôn tập. Tùy thuộc vào việc bạn có tìm thấy hiệu ứng tương tác hai chiều có ý nghĩa thống kê hay không và loại tương tác bạn có, sẽ xác định hiệu ứng nào trong ANCOVA hai chiều mà bạn nên diễn giải và bất kỳ kiểm tra Post Hoc nào mà bạn có thể muốn chạy để tìm hiểu thêm về kết quả của bạn.
ANCOVA hai chiều có thể được sử dụng để phân tích kết quả từ nhiều loại thiết kế nghiên cứu, nhưng nó được sử dụng rộng rãi cho hai loại thiết kế nghiên cứu: (a) nghiên cứu quan sát; và (b) một nghiên cứu thử nghiệm:
– Trong thiết kế quan sát: nhà nghiên cứu sắp xếp những người tham gia vào các nhóm khác nhau của hai biến độc lập dựa trên đặc điểm của các nhóm khác nhau đó. Nhà nghiên cứu muốn biết liệu có một hiệu ứng tương tác giữa hai biến độc lập theo một biến phụ thuộc liên tục hay không (tức là nếu tồn tại một tác động tương tác hai chiều). Một hoặc nhiều hiệp biến liên tục được sử dụng để kiểm soát thống kê được cho là có ảnh hưởng đến hiệu ứng tương tác này. Nếu có một hiệu ứng tương tác có ý nghĩa thống kê, điều này cho thấy rằng hiệu ứng mà một biến độc lập có trên biến phụ thuộc là phụ thuộc vào cấp độ của biến độc lập khác, sau khi kiểm soát (các) hiệp biến liên tục. Ví dụ 1 phân tích ở trên là một thiết kế khảo sát điển hình được sử dụng ANCOVA.
– Trong thiết kế thử nghiệm: nhà nghiên cứu đang điều khiển hai biến độc lập để những người tham gia khác nhau đang nhận được các can thiệp / điều kiện khác nhau. Nhà nghiên cứu muốn biết liệu có một hiệu ứng tương tác giữa hai biến độc lập theo một biến phụ thuộc liên tục hay không (tức là nếu tồn tại một tác động tương tác hai chiều). Một hoặc nhiều hiệp biến liên tục được sử dụng để kiểm soát thống kê được cho là có ảnh hưởng đến hiệu ứng tương tác này. Nếu có một hiệu ứng tương tác hai chiều có ý nghĩa thống kê, điều này cho thấy rằng ảnh hưởng mà một biến độc lập có đối với biến phụ thuộc là phụ thuộc vào mức độ của biến độc lập kia, sau khi kiểm soát (các) hiệp biến liên tục.
2. Giả định kiểm tra
Kiểm tra ANCOVA hai chiều có thể được sử dụng khi đáp ứng các giả định sau:
- Giả định 1: Biến phụ thuộc được đo lường ở thang khoảng hoặc mức tỷ lệ (tức là chúng liên tục). Ví dụ về các biến đáp ứng tiêu chí này bao gồm thời gian ôn tập (đo bằng giờ), trí thông minh (đo bằng điểm IQ), thành tích thi (đo từ 0 đến 100), cân nặng (đo bằng kg), v.v.
- Giả định 2: Hai biến độc lập của bạn, mỗi biến phải bao gồm hai hoặc nhiều nhóm phân loại, nhóm độc lập. Ví dụ các biến độc lập đáp ứng tiêu chí này bao gồm giới tính (nam và nữ), các mức độ hoạt động thể chất (với 4 nhóm: ít vận động, thấp, trung bình và cao), ngành học (với 4 nhóm: kỹ thuật, kinh tế, ngoại ngữ, sư phạm), v.v.
- Giả định 3: Một hoặc nhiều hiệp biến, được gọi là biến điều khiển (control variables), tất cả đều liên tục. Hiệp biến hiểu đơn giản là một biến độc lập liên tục được thêm vào mô hình ANOVA để tạo ra mô hình ANCOVA. Hiệp biến này được sử dụng để điều chỉnh các trung bình của các nhóm của hai biến độc lập phân loại. Trong ANCOVA, hiệp biến thường chỉ ở đó để cung cấp đánh giá tốt hơn về sự khác biệt giữa các nhóm của các biến độc lập phân loại về mặt biến phụ thuộc.
- Giả định 4: Bạn nên có sự độc lập với các quan sát, có nghĩa là không có mối quan hệ nào giữa các quan sát trong mỗi nhóm hoặc giữa các nhóm với nhau. Tức là không có người tham gia nào ở nhiều hơn một nhóm. Đây là một vấn đề thiết kế nghiên cứu, thay vì một cái gì đó bạn có thể kiểm tra, nhưng nó là một giả định quan trọng của ANCOVA hai chiều.
Nếu dữ liệu của bạn đáp ứng bốn giả định đầu tiên này, ANCOVA hai chiều có thể là một bài kiểm tra thống kê thích hợp để phân tích dữ liệu của bạn. Để xác định xem đó có phải là bài kiểm tra thống kê chính xác hay không, bây giờ bạn cần kiểm tra xem dữ liệu của mình có “vượt qua” thêm sáu các giả định.
- Giả định 5: Hiệp biến phải có liên quan tuyến tính với biến phụ thuộc cho mỗi tổ hợp các nhóm của các biến độc lập (tức là mỗi ô của thiết kế). Bạn có thể kiểm tra giả định này bằng cách vẽ biểu đồ phân tán được nhóm gộp và thêm các đường thẳng để giải thích dễ dàng hơn.
- Giả định 6: Cần có sự đồng nhất của độ dốc hồi quy. Giả định này kiểm tra rằng mối quan hệ giữa hiệp biến và biến phụ thuộc, được đánh giá bằng độ dốc hồi quy (regression slope), là giống nhau trong mỗi ô của thiết kế (nghĩa là đối với mỗi tổ hợp nhóm của hai biến độc lập). Nói một cách đơn giản, giả định trước đó đánh giá liệu các mối quan hệ có tuyến tính hay không; giả định này bây giờ kiểm tra xem các mối quan hệ tuyến tính này có giống nhau hay không.
- Giả định 7: Cần có phương sai không đổi (homoscedasticity). Một giả định quan trọng của ANCOVA hai chiều là phương sai của sai số là giống hệt nhau đối với tất cả các tổ hợp giá trị của các biến độc lập và hiệp biến. Phương sai không đổi (homoscedasticity) có thể được kiểm tra bằng cách vẽ đồ thị của các phần dư student hóa (studentized residuals) so với các giá trị được dự đoán cho mỗi ô của thiết kế.
- Giả định 8: Cần có sự đồng nhất của các phương sai. Có nghĩa là phương sai của các phần dư phải bằng nhau giữa mỗi tổ hợp của các nhóm của hai biến độc lập. Điều này có thể được kiểm tra bằng cách sử dụng kiểm tra Levene về sự bằng nhau của các phương sai.
- Giả định 9: Không có điểm bất thường đáng kể nào trong bất kỳ sự kết hợp nào giữa các nhóm của hai biến độc lập. Có ba loại điểm bất thường chính: điểm ngoại lệ, điểm đòn bẩy và điểm ảnh hưởng. Bạn có thể có các quan sát trong tập dữ liệu của mình có sự kết hợp bất thường của các giá trị trên các biến độc lập (tức là điểm đòn bẩy) hoặc ảnh hưởng đến ước tính tham số của ANCOVA hai chiều theo cách bất lợi (tức là điểm có ảnh hưởng). Bạn có thể kiểm tra các điểm bất thường bằng cách kiểm tra các giá trị của phần dư được student hóa (studentized residuals), giá trị đòn bẩy (leverage values) và giá trị khoảng cách Cook (Cook’s distance).
- Giả định 10: Phần dư phải được phân phối gần đúng chuẩn cho mỗi sự kết hợp của các nhóm của hai biến độc lập. Có nhiều phương pháp khác nhau có sẵn để kiểm tra giả định này, bao gồm bài kiểm tra Shapiro-Wilk về tính chuẩn, vẽ đồ thị Q-Q chuẩn (normal Q-Q plot).
Bạn có thể kiểm tra các giả định 5, 6, 7, 8, 9 và 10 bằng cách sử dụng Thống kê SPSS. Trước khi thực hiện việc này, bạn nên đảm bảo rằng dữ liệu của mình đáp ứng các giả định 1, 2, 3 và 4. Nếu bạn không chạy thử nghiệm thống kê trên các giả định này một cách chính xác, kết quả bạn nhận được khi chạy ANCOVA hai chiều có thể không chính xác.