Bài 8. One-way ANOVA F-test không liên quan (unrelated)
1. Khi nào sử dụng?
Kiểm định này được sử dụng khi nhà nghiên cứu muốn kiểm tra sự khác biệt giữa các trung bình của hai hoặc nhiều nhóm độc lập (các nhóm điều trị trong thiết kế thử nghiệm hoặc nhóm con trong thiết kế khảo sát và so sánh). Kiểm định này có thể được xem như một phần mở rộng của phép thử t độc lập (independent t-test) khi có từ ba nhóm độc lập trở lên. Trong một thiết kế không liên quan (unrelated design), các đối tượng khác nhau xuất hiện trong mỗi điều kiện hoặc phân nhóm điều trị. Giả thuyết được kiểm định bởi thống kê F là các trung bình của phân nhóm dân số (hoặc nhóm điều trị) là bằng nhau. Nhà nghiên cứu thường quan tâm đến các trung bình nào khác nhau và theo cách nào. Một biểu đồ của trung bình nhóm con có thể là rất nhiều thông tin cũng như các t-test về post hoc so sánh theo cặp của các trung bình phân nhóm.
2. Bố cục bảng kết quả cho One-way ANOVA (unrelated)
Dữ liệu tóm tắt các phép tính ANOVA thường được trình bày trong bảng ANOVA xác định các nguồn của phương sai, tổng bình phương và bậc tự do, trung bình bình phương và thống kê F.
Trong đó:
– df là các bậc tự do (Degrees of Freedom)
– SS là tổng phương sai (sums of squares)
– MS là trung bình bình phương (mean square), tính bằng tổng phương sai chia cho bậc tự do.
– F là tỉ lệ của MS hiệu ứng với MS sai số.
– k là số nhóm độc lập (điều trị hoặc phân nhóm)
– N là tổng số quan sát trong phân tích
– nj là số lượng quan sát trong nhóm thứ j.
3. Thủ tục phân tích One-way ANOVA F-test (unrelated)
Ví dụ, một nhà nghiên cứu muốn kiểm tra sự khác biệt giữa các trung bình trong các lớp cải thiện khả năng từ vựng tiếng Anh của học sinh tiểu học trong ba thử nghiệm đọc im lặng, kể chuyện và kể chuyện với hình ảnh. Có 30 học sinh tiểu học được lựa chọn ngẫu nhiên và phân thành ba phân nhóm (10 học sinh mỗi phân nhóm). Mỗi nhóm trải qua một lớp cải thiện khả năng từ vựng bằng sử dụng thêm không gian đọc im lặng, hoặc kể chuyện, hoặc kể chuyện với hình ảnh trong giờ học tiếng Anh. Kết thúc khóa thực nghiệm, kết quả điểm thi phần từ vựng trong bài thi tiếng Anh được nhà nghiên cứu thu thập và tổng hợp theo bảng dưới đây.
Ví dụ dữ liệu được trình bày trong trên.
– Df (between groups) là (3–1) = 2
– Bậc tự do giữa các cá nhân trong các nhóm, được gọi là df (error): (n1–1) + (n2–1) + (n3–1) = (10–1) + (10 − l) + (10−1) = 27. Hoặc df(error) thể được đánh giá đơn giản bằng phép trừ, df (error) = df (corrected total) −df (between groups) = (30–1) −2 = 27. Trong đó, df (corrected total) là số đối tượng −1, tức N-1 là (30–1) = 29.
Để tính giá trị F, quy trình chung là :1) Xác định các nguồn phương sai và tính tổng bình phương cho mỗi nguồn; 2) tính bậc tự do đối với mỗi nguồn phương sai; 3) đánh giá các trung bình bình phương; và 4) tính toán thống kê F và xác định xác suất.
Bước 1: Tính tổng phương sai
– Tổng bình phương giữa các nhóm (Sums of squares between groups) cho bởi công thức:
Trong đó: Tj là tổng điểm của nhóm thứ j, nj là số lượng quan sát trong phân nhóm thứ j, N là tổng số đối tượng, xi là điểm cá nhân.
Trong ví dụ:
– Tổng bình phương trong các cá nhân (error sums of squares) cho bởi công thức:
Trong ví dụ:
– Tổng bình phương tổng số sửa đổi (Corrected total sums of squares) cho bởi công thức:
Trong ví dụ: SSct = 9223 – 9048.0333 = 174.9667
– Chúng ta có thể dễ dàng nhận ra tổng bình phương sai số cho bởi công thức đơn giản:
SSerror = SSct – SSbet = 174.9667 – 22.4667 = 152.5
Bước 2: Tính bậc tự do
Trong ví dụ trên, df cho SSbet là 2, df cho SSerror là 27, và df cho SSct là 29
Bước 3: Đánh giá bình phương trung bình
– Bình phương trung bình giữa các nhóm (mean square for between groups):
MSbet = SSbet / dfbet = 22.4667 / 2 = 11.2333
– Trung bình bình phương sai số (Mean square error): MSerror = SSerror / dferror = 152.5 / 27 = 5.6481
Bước 4: Tính các F-ratio
Trong ví dụ này, chỉ có một F-ratio để tính toán, đó là một phép kiểm tra giả thuyết rằng điểm phân bổ trung bình của phân nhóm là bằng nhau. Thống kê F được đưa ra là MSbet / MSerror = 11.2333 / 5.6481 = 1.9889 với 2 và 27 bậc tự do. Bậc tự do của 2 tương ứng với bình phương tử số và bậc tự do của 27 tương ứng với mẫu số df.
Mô tả tóm tắt bảng kết quả ANOVA như sau:
Nhận xét kết quả: Chúng ta có thể tra cứu ý nghĩa của thống kê F tương ứng với mức alpha đã chọn là 5% (vui lòng xem bảng phân phối F). Chúng ta nhập cột ở đầu bảng với tử số df là 2 và tìm vị trí mà cột này giao với một hàng hoặc mẫu số df là 27. Giá trị F tới hạn trong phần nội dung của bảng là 3.35. Giá trị F quan sát được không nằm ngoài giá trị tới hạn này và do đó chúng ta không thể bác bỏ giả thuyết vô hiệu có giá trị trung bình bằng nhau, F = 1.9889, df 2, 27. Do đó, có vẻ như học sinh tiểu học trong ba thực nghiệm can thiệp (đọc im lặng, kể chuyện, kể chuyện với tranh ảnh) để cải thiện từ vựng là giống nhau về điểm số.
Bước 5: Kiểm tra post hoc đa so sánh (post hoc Multiple Comparison)
Khi một thống kê F có ý nghĩa đã được tìm thấy, bản chất của sự khác biệt giữa các trung bình cần được điều tra. Trong ví dụ này, thống kê F không có ý nghĩa nên các bài kiểm tra post hoc thường sẽ không thích hợp. Tuy nhiên, đối với mục đích minh họa, kiểm tra post hoc cho tất cả các so sánh từng cặp giữa các trung bình của các phân nhóm đều được minh họa.
Thủ tục kiểm tra post hoc thường được cung cấp bởi các gói phần mềm máy tính, bằng hạn SPSS. Trong phần hướng dẫn kiểm tra với SPSS, chúng tôi sẽ hướng dẫn chi tiết kiểm tra post hoc.
4. Phân tích One-way ANOVA F-test (unrelated) trong SPSS
– Bước 1: Click Analyze > Compare Means > One-Way ANOVA…
– Bước 2: Trong hội thoại One-Way ANOVA, chúng ta chuyển biến phụ thuộc “diemtuvung” vào ô Dependent List, chuyển nhân tố “phuongphap” vào ô Factor. Lưu ý rằng, chúng ta trong nhân tố “phuongphap” gán giá trị 1 = đọc im lặng, 2 = kể chuyện và 3 = kể chuyện với tranh.
– Bước 3: Bấm vào Option chọn Homegenety of variance test để kiểm định phương sai đồng nhất. Cuối cùng nhấp OK để chạy kết quả.
Phân tích kết quả:
– Bảng Test of Homegenety of Variances cung cấp thống kê Levene với các giá trị thống kê Levene, các bậc tự do và ý nghĩa thống kê. Giá trị p của thống kê Levene là 0.27 < 0.05 ở độ tin cậy 95% cho thấy phương sai là không bằng nhau, vi phạm giả định thống kê. Do đó, chúng ta không thể sử dụng kết quả phân tích ANOVA, mà cần thực hiện một bài kiểm tra khác thay thể, chẳng hạn kiểm định Welch.
– Giả sử rằng kiểm định Levene cho thấy phương sai bằng nhau, chúng ta có thể phân tích bảng ANOVA cung cấp kết quả thực tế của thống kê F. Kết quả phân tích ANOVA với mức ý nghĩa 0.156 > 0.05, như vậy với dữ liệu quan sát chưa đủ điều kiện để khẳng định có sự khác biệt điểm trung bình giữa các phương pháp điều trị (đọc im lặng, kể chuyện, và kể chuyện với tranh). Trong bảng phân phối F, chúng ta nhập cột ở đầu bảng với tử số df là 2 và tìm vị trí mà cột này giao với một hàng hoặc mẫu số df là 27. Giá trị F tới hạn trong phần nội dung của bảng là 3.35. Giá trị F quan sát được không nằm ngoài giá trị tới hạn này và do đó chúng ta không thể bác bỏ giả thuyết vô hiệu có giá trị trung bình bằng nhau, F = 1.989, df 2, 27. Do đó, có vẻ như học sinh tiểu học trong ba thực nghiệm can thiệp (đọc im lặng, kể chuyện, kể chuyện với tranh ảnh) để cải thiện từ vựng là giống nhau về điểm số.
Trong ví dụ này, thống kê F không có ý nghĩa nên các bài kiểm tra post hoc thường sẽ không thích hợp. Tuy nhiên, đối với mục đích minh họa, kiểm tra post hoc cho tất cả các so sánh từng cặp giữa các trung bình của các phân nhóm đều được minh họa. Câu hỏi được đặt ra là nhóm phương pháp can thiệp (bao gồm đọc im lặng, kể chuyện, kể chuyện với tranh) nào có sự khác biệt với nhóm phương pháp nào? Vấn đề này sẽ được giải quyết bằng phân tích sâu Anova, còn gọi là post-hoc test anova.
1. Khi nào sử dụng?
Kiểm định này được sử dụng khi nhà nghiên cứu muốn kiểm tra sự khác biệt giữa các trung bình của hai hoặc nhiều nhóm độc lập (các nhóm điều trị trong thiết kế thử nghiệm hoặc nhóm con trong thiết kế khảo sát và so sánh). Kiểm định này có thể được xem như một phần mở r . . .
This content is restricted to subscribers
Phần nội dung có thu phí bên dưới đã được ẩn.
Xin mời bạn đăng nhập để tiếp tục nội dung...
* Lưu ý: Bạn sẽ không thể đọc tài liệu nếu bạn chưa trả phí hoặc gói tài liệu trả phí của bạn đã hết hạn. Vui lòng đăng ký tài khoản Premium tại đây. |
Tài liệu tham khảo
- Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
- Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
- Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
- McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
- Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
- Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.