Bài 9. One-way ANOVA F-test liên quan (One-way ANOVA with repeated measures)

admin
11378 11 phút đọc

Kiểm định One-way ANOVA liên quan (related ANOVA) hay One-way với các phép đo lặp lại (One-way ANOVA with repeated measures) được sử dụng để so sánh ba nhóm trở lên có nghĩa là trong đó những người tham gia giống nhau trong mỗi nhóm. Điều này thường xảy ra trong hai tình huống: (1) khi những người tham gia được đo nhiều lần để xem các thay đổi đối với một can thiệp; hoặc (2) khi những người tham gia phải chịu nhiều hơn một điều kiện / thử nghiệm và phản ứng đối với từng điều kiện này muốn được so sánh.

1. Khi nào sử dụng?

Nhiều thiết kế nghiên cứu trong tâm lý giáo dục liên quan đến các đối tượng trong các phép đo lặp lại, đó là các đối tượng giống nhau (hoặc phù hợp) tham gia vào mỗi điều kiện thử nghiệm. Do đó, các quan sát hoặc đo lường có mối tương quan và hiệu quả điều trị được phân tích bằng cách sử dụng phân tích phương sai của phép đo lặp lại. Một tên khác của phân tích này là ANOVA trong đối tượng (within subjects ANOVA) vì so sánh hiệu quả điều trị là trong đối tượng.

Trong ANOVA liên quan (related ANOVA), sự khác biệt về điểm số được quy cho các cá nhân, (đối tượng) có thể được điều trị như một nguồn phương sai riêng biệt, bời vì các đối tượng giống nhau tham gia vào từng điều kiện điều trị. Nguồn phương sai này được gọi là Phương sai đối tượng (Subjects variance), SS(subj). Các thành phần phương sai khác, chúng có trong ANOVA một chiều là một nguồn phương sai được quy cho giữa (between) các điều kiện điều trị, SS(bet) và phương sai sai số thể hiện sự khác biệt giữa các đối tượng trong (within) mỗi điều kiện điều trị, SS(error). Hãy nhớ lại rằng trong ANOVA không liên quan một chiều, chúng ta chỉ có hai nguồn phương sai: giữa các phương pháp điều trị và bên trong các cá nhân (hay phương sai sai số).

Trong một ANOVA liên quan, kiểm định ý nghĩa F thường được xây dựng dựa trên tỷ lệ, MS(bet)/MS(error), sai số được giảm xuống so với những gì nó sẽ có trong một phân tích không liên quan vì phương sai được tính bởi các đối tượng có được phân vùng riêng biệt. Trong hầu hết các phân tích đo lường lặp lại, các đối tượng được điều trị như một hiệu ứng ngẫu nhiên trong mô hình thống kê, hiệu ứng điều trị thường được coi là cố định. Trong ANOVA liên quan, MS(error) không phải là một sai số thuần túy vì một phần của sự thay đổi trong các đối tượng là do các phương pháp điều trị khác nhau và một phần là do sự khác biệt của từng cá nhân. Do đó, kiểm định F về mức độ ý nghĩa đối với các đối tượng không có giá trị trừ khi chúng ta sẵn sàng giả định rằng không có sự tương tác giữa đối tượng và phương pháp điều trị. Thông thường đây không phải là vấn đề vì nhà nghiên cứu quan tâm đến sự khác biệt giữa các trung bình điều trị chứ không phải sự khác biệt giữa các đối tượng.

Các giả định đối với ANOVA liên quan cũng giống như đối với phân tích không liên quan với các yêu cầu bổ sung về tính đồng nhất của hiệp phương sai giữa các sai số dân số đối với các phương pháp điều trị khác nhau và sự độc lập của các sai số đối với các điều kiện điều trị khác nhau.

2. Thủ tục phân tích One-way ANOVA F-test (Related)

Ví dụ, một nhà nghiên cứu muốn kiểm tra sự khác biệt giữa các trung bình trong các lớp cải thiện khả năng từ vựng tiếng Anh của học sinh tiểu học trong ba thử nghiệm đọc im lặng, kể chuyện và kể chuyện với hình ảnh. Có 10 học sinh tiểu học được lựa chọn tham gia một lớp cải thiện khả năng từ vựng bằng sử dụng thêm không gian đọc im lặng, hoặc kể chuyện, hoặc kể chuyện với hình ảnh trong giờ học tiếng Anh. Kết thúc mỗi lớp thử nghiệm với phương pháp đọc im lặng, kể chuyện, kể chuyện với tranh, 10 học sinh trải một một bài kiểm tra từ vựng tiếng anh với số lượng từ trả lời đúng. Các kết quả được nhà nghiên cứu thu thập và tổng hợp theo bảng dưới đây.

Để tính giá trị F, quy trình chung là :1) Tính tổng bình phương cho mỗi nguồn; 2) tính bậc tự do đối với mỗi nguồn phương sai; 3) đánh giá các bình phương trung bình; và 4) tính toán thống kê F và xác định xác suất.

Bước 1: Tính tổng phương sai

– Tổng bình phương giữa các điều trị/ điều kiện (Sums of squares between treatments/conditions) cho bởi công thức:

Trong đó: Ts là tổng điểm cho tất cả đối tượng ở mỗi phương pháp điều trị; nj là số lượng quan sát trong phân nhóm thứ j (nhóm điều trị); nt là số lượng điều trị; ns là số lượng đối tượng; xi là điểm cá nhân.

Trong ví dụ:

– Tổng bình phương cho các đối tượng trong các điều trị/ điều kiện:

Trong đó: Trm là tổng điểm trên phép đo lặp lại cho mỗi đối tượng; nrm là số phép đo lặp lại.

Trong ví dụ:

– Tổng bình phương tổng số sửa đổi (Corrected total sums of squares) cho bởi công thức:

Trong ví dụ: SSct = 9223 – 9048.0333 = 174.9667

– Tổng bình phương sai số (error sums of squares) cho bởi công thức:

SSerror = SSct – SSsubj – SSbet = 174.9667 – 64.3 – 22.4667 = 88.2

Bước 2: Tính bậc tự do

Df cho SS(bet) là số điều kiện − 1 = 2; df cho SS(subj) là số đối tượng − 1 = 9; df cho SS(ct) là tổng số của điểm − 1 = 29; và df cho SS(error) thu được bằng cách trừ (df (bet) + df (subj)) từ df(ct) = (29 − (2 + 9)) = 18.

Bước 3: Đánh giá bình phương trung bình

– Bình phương trung bình giữa các điều kiện (mean square for between conditions):

MSbet = SSbet / dfbet = 22.4667 / 2 = 11.2333

– Tương tự: MSsubj = SSsubj / dfsubj = 64.3 / 9 = 7.1444

– MSerror = SSerror / dferror = 88.2 / 18 = 4.9

Bước 4: Tính các F-ratio

Giả thuyết chính được quan tâm là liệu có bất kỳ sự khác biệt nào về điểm trung bình từ vựng trong các phương pháp điều trị (đọc im lặng, kể chuyện, kể chuyện với tranh hay không. Kiểm định của giả thuyết này được đưa ra bởi thống kê F-test là MS(bet) / MS(error) = 11.2333 / 4.9 = 2.2925. Nếu chúng ta giả định không có sự tương tác giữa các đối tượng và các lần đo (lần điều trị), giả định về sự khác biệt tổng thể giữa các đối tượng được kiểm định bằng thống kê F là MS(subj) / MS(error) = 7.1444 / 4.9 = 1.458.

Mô tả tóm tắt bảng kết quả ANOVA như sau:

Nhận xét kết quả: Đối với hiệu ứng giữa các điều kiện, giá trị tới hạn của F ở mức 5% với 2 và 18 df là 3.55 (tra bảng phân phối F). Vì F thu được bằng 2.2925 nhỏ hơn giá trị này, chúng ta có không thể bác bỏ giả thuyết vô hiệu và kết luận rằng không có sự khác biệt đáng kể về điểm trung bình từ vựng trong ba lần can thiệp; F=2.2925; df 2, 18; p <0.05. Đối với các đối tượng, F tới hạn là 2.51 (lấy cột 9, hàng 18), vì giá trị quan sát là 1.458 nhỏ hơn giá trị này nên chúng ta có thể kết luận rằng về tổng thể, sự khác biệt giữa các đối tượng không có ý nghĩa thống kê.

Nếu F có ý nghĩa thống kê, các bài kiểm tra Post hoc sẽ được tiến hành tiếp theo để so sánh từng cặp khác nhau. Điều này sẽ được giới thiệu trong gói thống kê của SPSS.

 

3. Phân tích One-way ANOVA F-test (Related) trong SPSS

– Bước 1: Click Analyze > Compare Means > Repeated Measure…

– Bước 2: Trong hội thoại Repeated Meassures Define Factor, tại hộp Within-Subject Factor Name, hãy thay thế “factor1” bằng một tên có ý nghĩa hơn cho biến độc lập của bạn. Trong ví dụ này, chúng ta sẽ gọi tên biến độc lập của mình là phuongphap vì nó đại diện cho các phương pháp khác nhau (đọc im lặng, kể chuyện, kể chuyện với tranh) mà chúng ta thực hiện kiểm tra từ vựng từ những người tham gia của mình. Nhập vào hộp Number of Levels (số lần biến phụ thuộc đã được đo lường). Trong trường hợp này, hãy nhập “3“, đại diện cho phương pháp đọc im lặng, kể chuyện và kể chuyện với tranh. Trong hộp Measure Name, chúng ta nhập tên cho biến phụ thuộc, chẳng hạn trong ví dụ, tên biến phụ thuộc có thể đặt là “Diemtuvung”. Sau mỗi hộp hãy nhấp vào Add.

– Bước 3: Nhấp vào Define, một hộp thoại Repeated Measured xuất hiện. chuyển hộp “Docimlang”, “Kechuyen”“Kechuyenvoitranh” vào trong hộp Within-Subjects Variables (phuongphap).

– Bước 4: Nhấp vào Plots…, Chuyển nhân tố “phuongphap” từ hộp Factors vào hộp Horizontal Axis. Sau đó nhấp nút Add. Sau đó nhấp Continue.

– Bước 5: Nhấp vào Options…, chuyển yếu tố “phuongphap” từ Factor(s) and Factor Interactions sang hộp Display Means for. Đánh dấu vào hộp Compare main effects, chọn kĩ thuật Bonferroni trong tùy chọn Confidence interval adjustment. Sau đó đánh dấu vào các hộp kiểm Descriptive statisticsEstimates of effect size trong vùng Display. Sau đó nhấp Continue.

– Bước 6: Tại hộp thoại Repeated Measured, nhấp OK để chạy kết quả.

Phân tích kết quả:

Bảng Within-Subjects Factors nhắc nhở chúng ta về các nhóm của biến độc lập và gán các nhãn 1, 2 và 3. Chúng ta sẽ cần các nhãn này sau này khi phân tích kết quả của mình trong bảng So sánh theo cặp (Pairwise Comparisons).

Bảng Thống kê Mô tả (Descriptive Statistics) cung cấp các thống kê mô tả quan trọng cho phân tích này.

Bảng Kiểm tra Mauchly của tính cầu (Mauchly’s Test of Sphericity) được sử dụng để xác nhận phương sai các phép đo lặp lại (ANOVA). Kiểm tra Mauchly cho rằng phương sai của sự khác biệt giữa các cặp của điều kiện/điều trị trong đối tượng là bằng nhau (giả thuyết tính cầu). Nếu điều này xảy ra thì dẫn đến F-ratio có thể bị thổi phồng. Trong ví dụ này, p = 0.385 > 0.05 cho thấy giả định về tính cầu được đáp ứng. Vì vậy, chúng ta không cần bất kỳ sự điều chỉnh nào như Greenhouse-Geisser, Huynh-Feldt.

Bảng Kiểm tra Hiệu ứng Bên trong Đối tượng (Tests of Within-Subjects Effects) cho chúng ta biết liệu có sự khác biệt đáng kể tổng thể giữa các trung bình tại các thực nghiệm khác nhau hay không.

Từ bảng này, chúng ta có thể khám phá giá trị F cho yếu tố “phuongphap”, mức ý nghĩa liên quan. Vì dữ liệu đáp ứng giả định về tính cầu, nên chúng ta xem xét các giá trị trong hàng “Sphericity Assumed”. Chúng ta có thể báo cáo rằng khi sử dụng ANOVA, điểm trung bình cho từ vựng tiếng Anh là không khác biệt: F (2, 18) = 2.293, p = 0.13 > 0.05).

Bảng Kiểm tra Hiệu ứng giữa Đối tượng (Tests of Between-Subjects Effects) cho chúng ta tổng bình phương, bậc tự do và bình phương trung bình của sai số. Nếu chúng ta giả định không có sự tương tác giữa các đối tượng và các lần đo (lần điều trị), giả định về sự khác biệt tổng thể giữa các đối tượng được kiểm định bằng thống kê F(2, 18) là 7.1444 / 4.9 = 1.458.

Bảng Ước lượng (Estitates) cung cấp các tham số ước lượng (trung bình, sai số chuẩn, và khoảng tin cậy của các điểm từ vựng trong mỗi phương pháp trị liệu bao gồm, đọc im lặng (mean = 16.4, Std. error = .777, CI 95% = 14.641 đến 18.159), kể chuyện (mean = 17.2, Std. error = .359, CI 95% = 16.388 đến 18.012), kể chuyện với tranh (mean = 18.5, Std. error = .980, CI 95% = 16.282 đến 20.718). Kết quả kiểm tra ANOVA đã báo cáo điểm trung bình cho từ vựng tiếng Anh là không khác biệt. Do vậy, mặc dù có sự chênh lệch điểm trung bình giữa các lần điều trị, nhưng sự khác biệt này là nhỏ và không có ý nghĩa thống kê.

Trong Bảng so sánh theo cặp (Pairwise Comparisons), nếu kết quả kiểm tra trong bảng trước cho chúng ta thấy F có ý nghĩa thống kê, bảng này trình bày kết quả của bài kiểm tra Bonferroni post hoc, cho phép chúng ta khám phá những phương tiện cụ thể nào khác nhau. Hãy nhớ rằng, nếu kết quả ANOVA tổng thể là không có ý nghĩa, bạn không nên kiểm tra bảng Pairwise Comparisons. Trong ví dụ này thì không (F-test không có ý nghĩa thông kê), tuy nhiên, công việc trong ví dụ này mang tính tượng trưng nên chúng tôi vẫn thực hiện minh họa.

Nhìn vào bảng Pairwise Comparisons, chúng ta cần nhớ các nhãn được liên kết với các phương pháp trong thử nghiệm của chúng ta. Bảng này cho chúng ta mức ý nghĩa đối với sự khác biệt giữa các phương pháp riêng lẻ. Kết quả sự so sánh theo cặp cho thấy, giá trị p > 0.05 trong tất cả các trường hợp biểu lộ rằng không có sự khác biệt đáng kể giữa các trung bình điểm số từ vựng trong các lớp can thiệt đọc im lặng, kể chuyện, và kể chuyện với tranh. Trong tất cả trường hợp, khoảng tin cậy là chứa số không “0” nên khẳng định chắc chắn rằng không có sự khác biệt về các trung bình giữa các cặp với mức ý nghĩa 95%.

Biểu đồ này là yếu tố cuối cùng trong phân tích này. Chúng ta thấy rằng mặc dù có sự khác biệt giữa điểm ước lượng trung bình của điểm từ vựng trong 3 lớp can thiệp (đọc im lặng = 1, kể chuyện = 2, và kể chuyện với tranh = 3). Có một xu hướng tăng điểm nhẹ của điểm từ vựng khi chuyển từ lớp đọc im lặng, qua kể chuyện, và kể chuyện với tranh. Tuy nhiên, sự tăng điểm trung bình này là nhỏ, không đáng kể, từ xấp xỉ 16.5 đến 18.5 điểm.

 

Tài liệu tham khảo

  1. Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
  3. Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

admin

Chịu trách nhiệm học thuật, PGS.TS. Nguyễn Văn Hạnh
Chuyên gia nghiên cứu Khoa học Giáo dục và Phân tích định lượng.

error: Content is protected !!
0
Would love your thoughts, please comment.x
()
x