Bài 7. Cochran’s Q Test
Kiểm tra Cochran Q được sử dụng để xác định xem liệu có sự khác biệt trên một biến phụ thuộc nhị phân giữa ba hoặc nhiều nhóm liên quan (related groups) hay không. Nó có thể được coi là tương tự như ANOVA các phép đo lặp lại một chiều, nhưng đối với một biến nhị phân chứ không phải là một biến phụ thuộc liên tục, hoặc như một phần mở rộng của kiểm tra McNemar. Kiểm tra Cochran Q thường được sử dụng để phân tích các thiết kế nghiên cứu theo chiều dọc, cũng như được sử dụng khi phân tích những người tham gia đã trải qua nhiều thử nghiệm khác nhau.
1. Khi nào sử dụng?
Bài kiểm tra này thích hợp khi thiết kế nghiên cứu liên quan đến các đối tượng thực hiện trong các điều kiện khác nhau (các phép đo lặp lại) mà biến phản hồi là nhị phân (điểm số 1, 0). Biến phản hồi được chỉ định tùy ý 1 cho thành công và 0 cho thất bại. Các phép đo lặp lại có thể là hai hoặc nhiều quan sát trên cùng một đối tượng trong một loạt các lần thử độc lập (điều kiện điều trị) hoặc các các đối tượng khớp cặp. Kiểm tra Cochran Q thích hợp để phát hiện xem tỷ lệ thành công có không đổi qua các lần thử hay không.
Ví dụ, hiệu trưởng một trường nào đó muốn biết ba đề thi môn Toán có khó như nhau không. Mười học sinh đã được chọn để thực hiện các bài kiểm tra này. Như vậy, các biến kết quả này đã được đo lường trên cùng một người, thang điểm 10. Các kết quả được mã hóa thành giá trị 0 là Không đạt (<5 điểm), và 1 là Đạt (≥5 điểm).
Mục đích của kiểm tra Cochran Q là để xác định xem các tập hợp liên quan của các quan sát nhị phân có khác nhau hay không. Khi các phép đo liên quan tương ứng với một loạt các quan sát trên cùng một đối tượng trong các điều kiện điều trị khác nhau, thống kê Q cung cấp một bài kiểm tra xem liệu các phương pháp điều trị có khác biệt đáng kể hay không.
2. Suy luận thống kê và giả thuyết vô hiệu
Giả thuyết vô hiệu là các phương pháp điều trị đều có hiệu quả như nhau. Giả thuyết thay thế là các phương pháp điều trị không có hiệu quả giống nhau.
3. Giả định kiểm tra
Kiểm định Cochran Q có thể được sử dụng khi đáp ứng các giả định sau:
- Biến phản hồi là nhị phân và các quan sát là có liên quan với nhau, cùng một đối tượng được quan sát dưới các điều kiện điều trị khác nhau (các lần đo) hoặc các đối tượng khớp cặp.
- Các quan sát độc lập (hay chính xác hơn là các biến độc lập) và phân phối giống hệt nhau. Phương sai dân số cho tất cả các cặp của các điều trị là như nhau.
- Phân phối mẫu của thống kê Q gần đúng với phân phối χ2 với bậc tự do là số cột −1. Tuy nhiên, giá trị gần đúng này chỉ hợp lệ khi tích của số đối tượng (hàng) và phương pháp điều trị (cột) là ≥24.
Các suy luận với thống kê Q cần được tiến hành thận trọng:
- Đầu tiên là đánh giá thống kê Q so với một tiêu chí bảo thủ, (c-1) χ21 (χ12 nghĩa là Chi-square với 1 df và c là số cột). Ví dụ, với alpha là 5% và với 3 cột trong bảng dự phòng, chúng tôi sẽ đánh giá Q dựa trên giá trị tới hạn của (3-1)χ12 = 2 × 3.841 = 7.628. Nếu thống kê kiểm tra Q vượt quá giá trị tới hạn là 7.628, chúng ta sẽ bác bỏ giả thuyết vô hiệu.
- Nếu kiểm tra đầu tiên ở trên là không có ý nghĩa, chúng ta tiếp tục so sánh thống kê kiểm định Q với một χ2c-1 (df là c-1). Nếu tiêu chí phóng khoáng này là không có ý nghĩa, chúng ta không bác bỏ giả thuyết vô hiệu và dừng lại ở điểm này.
- Nếu bài kiểm tra đầu tiên chống lại giá trị tới hạn bảo thủ là không đáng kể nhưng kiểm tra thứ hai là chống lại giá trị tới hạn phóng khoáng hơn, chúng ta hãy xem xét tính toán Q điều chỉnh và kiểm tra điều này dựa trên χ2 với (c − 1) df.
4. Thủ tục kiểm tra Cochran Q
Ví dụ, hiệu trưởng một trường nào đó muốn biết ba đề thi môn Toán có khó như nhau không. Mười học sinh đã được chọn để thực hiện các bài kiểm tra này. Như vậy, các biến kết quả này đã được đo lường trên cùng một người, thang điểm 10. Các kết quả được mã hóa thành giá trị 0 là Không đạt (<5 điểm), và 1 là Đạt (≥5 điểm). Khi N = 10 cho tất cả các biến, chúng ta kết luận không có giá trị nào bị thiếu.
Dữ liệu thu thập được trình bày trong bảng dưới đây:
Giả thuyết vô hiệu là không có sự khác biệt giữa độ khó của ba đề thi môn toán. Mức ý nghĩa Alpha được thiết lập là 5% và số ô là 30 (10 × 3).
Sau khi điều chỉnh cho 1 hàng (đối tượng 2) có tất cả 1, số lượng ô giảm xuống còn 27 (9 × 3) lớn hơn 24, đây là số lượng tối thiểu để sử dụng xấp xỉ χ2.
Thống kê Q được tính bằng công thức sau:
Trong đó J là số lần điều trị.
Nhận xét:
Đầu tiên, giá trị thống kê Q thu được (0.667) được đánh giá với giá trị tới hạn bảo thủ của (c-1) χ12 = (3-1) χ12 = 2 × 3.841 = 7.628. Ước lượng bảo thủ này điều chỉnh cho tính không đồng nhất (heterogeneity) của các phương sai và khiến tỉ lệ Lỗi loại I được thổi phồng.
Giá trị quan sát của Q, 0.667, không vượt quá giá trị tới hạn bảo thủ này (ở ý nghĩa ở mức 5%) và do đó Q được kiểm tra dựa trên giá trị tới hạn phóng khoảng hơn. Giá trị tới hạn phóng khoáng này tương đương với χ2 với (c – 1 = 2) df (vui lòng tra bảng χ2). Ở đây chúng ta thấy giá trị tới hạn thu được của Q, 0.667 < 5.991, cho thấy thống kê Q không đạt được ý nghĩa thống kê ở giá trị tới hạn phóng khoáng. Chúng ta không bác bỏ giả thuyết vô hiệu (xác suất của 1 “thành công” không khác nhau trong ba đề thi toán). Chúng ta kết luận rằng không có sự khác biệt giữa độ khó của ba đề thi môn toán.
4. Kiểm tra Cochran Q trong SPSS
Các bước chạy Cochran Q trong SPSS như sau:
Bước 1. Click Analyze > Nonparametric Tests > Legacy Dialogs > K Related Samples…
Bước 2. Trong hộp thoại Tests for Several Related Samples, chúng ta chuyển các biến Test1, Test2, Test3 vào hộp Test Variables. Chọn Cochran’s Q trong vùng Test Type. Nhấp vào Descriptive và chọn Statistics, nhấn Continue. Cuối cùng nhấp OK để chạy kết quả.
Đọc kết quả:
– Bảng đầu tiên về thống kê mô tả (Descriptive Statistics) trình bày các mô tả mà chúng ta sẽ báo cáo. Đầu tiên, vì N = 10 nên xác nhận rằng không có giá trị nào bị thiếu trong mỗi biến và tỉ lệ điểm nằm trong khoảng từ 0.5 đến 0.7.
– Bảng thống kê kiểm tra (Test Statistics) trình bày kết quả của kiểm tra ý nghĩa. Giá trị p (Asymp. Sig.) = 0.667; nếu ba bài thi môn toán thực sự khó như nhau trong dân số, có 66,7% cơ hội tìm thấy sự không khác biệt mà chúng ta quan sát được trong mẫu này. Vì cơ hội này lớn hơn 5%, chúng ta không bác bỏ giả thuyết vô hiệu và kết luận rằng các bài kiểm tra đều khó như nhau.
Báo cáo kết quả kiểm tra Q của Cochran: Khi báo cáo kết quả từ kiểm định Q Cochran, trước tiên chúng ta trình bày các thống kê mô tả nói trên. Thống kê Q Cochran tuân theo phân phối χ2, vì vậy chúng ta sẽ báo cáo một cái gì đó như “Kiểm tra Q Cochran không chỉ ra bất kỳ sự khác biệt nào giữa ba tỷ lệ, χ 2 (2 df) = 0.667 (<5.991 ở mức ý nghĩa 5%, df=2), p = 0.717 (>.05)”.
Tài liệu tham khảo
- Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
- Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
- Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
- McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
- Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
- Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.