Bài 10. ANOVA hai chiều giai thừa 2 × 2 (không liên quan) [Two-way ANOVA 2×2 Factorial (unrelated)]

admin
9408 12 phút đọc

Trong bài trước, chúng tôi đã giới thiệu các thiết kế One-way ANOVA liên quan đến nhiều cấp độ của một biến (hoặc nhân tố) độc lập. Bài này sẽ giới thiệu một mô hình ANOVA phức tạp hơn cho phép nhà nghiên cứu kiểm tra hiệu ứng của hai biến độc lập; do đó, thủ tục này được gọi là ANOVA hai chiều hay ANOVA giai thừa (Two-way ANOVA). Nghĩa là ANOVA hai chiều cải thiện ANOVA một chiều ở chỗ nhà nghiên cứu có thể đánh giá đồng thời hiệu ứng của hai (hoặc nhiều) biến độc lập lên một biến phụ thuộc duy nhất trong cùng một phân tích. Do đó, ANOVA hai chiều cung cấp cùng một thông tin mà hai ANOVA một chiều sẽ có, nhưng nó làm trong một phân tích.

ANOVA hai chiều cũng cho phép người điều tra xác định các hiệu ứng tổng hợp có thể có của các biến độc lập. Nghĩa là, nó cũng đánh giá cách thức mà các biến này tương tác với nhau để ảnh hưởng đến điểm số trên biến phụ thuộc. Mặc dù hiểu được các hiệu ứng tương tác như vậy có thể là một nhiệm vụ phức tạp và khó khăn, nhưng nó là điều cần thiết đối với sự tiến bộ của khoa học, vì trong thế giới thực, nhiều biến số tương tác với nhau để xác định hành vi.

Cơ sở khái niệm của ANOVA hai chiều về cơ bản giống với ANOVA một chiều và việc giải thích các giá trị F kết quả cũng dựa trên logic tương tự như trong ANOVA một chiều. Sự khác biệt là trong đó ANOVA một chiều chỉ tạo ra một giá trị F, ANOVA hai chiều tạo ra ba giá trị F: một để kiểm tra các hiệu ứng chính của từng yếu tố và một phần ba để kiểm tra hiệu ứng tương tác (tức là hiệu ứng kết hợp của hai yếu tố).

1. Sự kết hợp giai thừa của các biến độc lập

Yêu cầu cơ bản đối với thiết kế thực nghiệm giai thừa là các mức của hai biến độc lập đã được vượt qua hoàn toàn trong một tổ hợp giai thừa. Điều này có nghĩa là mỗi cấp của biến độc lập đầu tiên phải được kết hợp với từng cấp của biến độc lập khác. Trong ANOVA hai chiều đơn giản nhất (thiết kế 2 x 2), sẽ cần bốn nhóm người tham gia khác nhau. Nếu yếu tố đầu tiên (Yếu tố A) là GIỚI TÍNH (trong đó cấp độ A1 là nam và cấp độ A2 là nữ) và yếu tố thứ hai (Yếu tố B) là CHỖ Ở (trong đó cấp độ B1 là nông thôn và cấp độ B2 là thành thị), khi đó bốn sự kết hợp là cần thiết để định hình một ANOVA giai thừa 2 x 2. Mỗi kết hợp duy nhất được gọi là một ô (xem Bảng dưới đây). Trong bảng này, bốn ô đại diện cho bốn kết hợp có thể có.

Bốn ô của sự kết hợp giai thừa cho thiết kế giai thừa 2 (Giới tính) x 2 (Chỗ ở) chia những người tham gia thành bốn nhóm sau: Nam nông thôn (A1B1), Nam thành thị (A1B2), Nữ nông thôn (A2B1), và Nữ thành thị (A2B2).

Sự kết hợp giai thừa này sẽ cho phép chúng ta so sánh điểm số của nam giới so với nữ giới (GIỚI TÍNH) và chỗ ở của học sinh (CHỖ Ở) trên một biến phụ thuộc nhất định. Điều này sẽ giống như nếu chúng ta thực hiện hai nghiên cứu riêng biệt và thực hiện hai bài t-test. Nhưng sẽ tiết kiệm và hiệu quả hơn, bởi vì chúng ta sẽ nhận được cùng một thông tin từ một nghiên cứu và một phân tích (Two-way ANOVA 2 x 2). Điều quan trọng đối với sự kết hợp giai thừa của hai biến độc lập này là chúng ta cũng có thể đánh giá tác động tương tác có thể có của hai biến độc lập được kết hợp.

2. Khi nào sử dụng?

Khi một khảo sát hoặc thiết kế thử nghiệm có hai biến (nhân tố) độc lập và mọi cấp độ của một nhân tố được ghép nối với mọi cấp độ của nhân tố kia, điều này được gọi là thiết kế giai thừa và có thể được phân tích bằng ANOVA thừa số 2 × 2. Trong thiết kế này, các đối tượng khác nhau xuất hiện trong mỗi tổ hợp các cấp độ khác nhau của các yếu tố, do đó thuật ngữ này là không liên quan (unrelated). Trong thiết kế 2 × 2, có hai yếu tố, mỗi yếu tố có hai cấp cho bốn ô. Do đó, kết quả có thể được phân tích bằng cách kiểm tra hiệu ứng chính của từng yếu tố, (bỏ qua ảnh hưởng của yếu tố kia) và bằng cách tìm kiếm các hiệu ứng tương tác. Phân tích giai thừa được thực hiện bởi vì nhà nghiên cứu tin rằng sẽ có sự tương tác đáng kể giữa hai biến độc lập. Trong thiết kế giai thừa 2 × 2 không liên quan, chỉ có một điểm cho mỗi đối tượng (đơn vị thử nghiệm) và nếu thiết kế cân bằng thì sẽ có số lượng của các đối tượng (và các điểm số) bằng nhau trong mỗi ô trong số bốn ô của thiết kế.

Trong phân tích này, tổng phương sai giữa các đối tượng (total variance between subjects) được phân chia thành ba thành phần riêng biệt, tổng bình phương cho mỗi nhân tố, SSF1, SSF2 và tổng bình phương của tương tác SSF1×F2. Bất kỳ sự khác biệt nào giữa các đối tượng trong mỗi sự kết hợp của các điều kiện điều trị là được tính như một nguồn của phương sai sai số. Tổng bình phương của tương tác có thể được tính toán, sử dụng máy tính bỏ túi, bằng cách tính tổng bình phương cho cả bốn ô trong thiết kế và sau đó trừ tổng bình phương cho từng yếu tố đơn lẻ. Phân tích máy tính đánh giá sự tương tác bằng sự phù hợp trước tiên một mô hình thống kê đầy đủ và sau đó so sánh các giá trị ước lượng với một mô hình suy giảm với sự tương tác đã bị xóa. Một vấn đề cuối cùng mà các nhà nghiên cứu đôi khi gặp phải với các thiết kế giai thừa là việc lựa chọn sai số thích hợp cho mẫu số của phép thử F khi một mô hình hiệu ứng ngẫu nhiên hoặc mô hình hiệu ứng cố định (yếu tố cố định và ngẫu nhiên) là được phù hợp. Cách lựa chọn các sai số và cách chỉ định chúng trong phân tích sẽ được mô tả trong ví dụ tiếp sau đây.

3. Diễn giải kết quả của ANOVA hai chiều

Ba tỉ lệ F riêng biệt được tính toán để xác định có bao nhiêu phương sai trong biến phụ thuộc có thể được quy cho mỗi trong ba tác động này. Mỗi giá trị F đại diện cho tỷ lệ của phương sai từ tác động cụ thể đó so với phương sai sai số ngẫu nhiên. Do đó, ba nguồn của phương sai giữa các nhóm (hiệu ứng chính của Yếu tố A, hiệu ứng chính của Yếu tố B và sự tương tác A x B) dẫn đến ba giá trị F. Như trong ANOVA một chiều, ý nghĩa của mỗi ảnh hưởng được quyết định bằng cách xem xét xác suất liên quan đến mỗi giá trị F (tức là, nếu p <0.05, hiệu ứng là đáng kể).

Việc giải thích các hiệu ứng chính từ ANOVA giai thừa 2 x 2 rất đơn giản. Nếu p <0.05 đối với hiệu ứng chính của một yếu tố cụ thể, thì đây là hiệu ứng đáng kể đối với yếu tố đó. Tất cả những gì chúng ta phải làm là kiểm tra các trung bình cận biên đối với các cấp độ của yếu tố để xác định xem nhóm nào cao hơn (hoặc thấp hơn) đáng kể so với nhóm kia, sau đó nói rõ sự khác biệt là gì.

Việc giải thích hiệu ứng tương tác là phức tạp hơn. Nếu giá trị F của hiệu ứng tương tác không có ý nghĩa (tức là p > 0.05), thì kết luận của chúng ta sẽ là sự khác biệt về giới trong điểm số từ vựng tiếng anh của học sinh không phụ thuộc vào chỗ ở của họ. Nếu giá trị F cho tương tác  đáng kể ( p <0.05), thì chúng ta sẽ kết luận rằng sự khác biệt giới tính về điểm số từ vựng phụ thuộc vào chỗ ở của học sinh. Ví dụ: chẳng hạn, khi so sánh học sinh nam nông thôn với học sinh nữ nông thôn, học sinh nam có điểm số từ vựng cao hơn học sinh nữ, nhưng khi so sánh học sinh nam và học sinh nữ ở thành thị, chúng ta có thể thấy không có sự khác biệt đáng kể về điểm từ vựng tiếng Anh giữa hai nhóm này. Ví dụ trên về việc giải thích một tương tác quan trọng sẽ yêu cầu so sánh bốn trung bình ô liên quan đến hiệu ứng tương tác.  Thật không may, SPSS không có tùy chọn để tính toán nhiều phép so sánh cho ANOVA giai thừa, vì vậy nhà nghiên cứu phải thực hiện các phân tích này bằng tay. Hiện tại, đủ để nói rằng những so sánh này sẽ cho phép chúng ta đưa ra kết luận cụ thể về các hiệu ứng tương tác.

 

4. Phân tích ANOVA hai chiều giai thừa 2 × 2 trong SPSS

Ví dụ, một nhà nghiên cứu muốn kiểm tra hiệu ứng của yếu tố giới tính và yếu tố khu vực đến sự cải thiện khả năng giao tiếp tiếng Anh của học sinh tiểu học thông qua sử dụng phương pháp trò chuyện theo cặp. Có 20 học sinh tiểu học được lựa chọn tham gia một lớp cải thiện khả năng giao tiếp tiếng Anh, trong đó 10 nam (5 thành thị và 5 nông thôn), và 10 nữ (5 thành thị và 5 nông thôn). Kết thúc lớp thử nghiệm, 20 học sinh điều trải một một bài kiểm tra khả năng giao tiếp tiếng Anh và các kết quả được nhà nghiên cứu thu thập, đánh giá.

Các bước phân tích Two-way ANOVA 2×2 trong SPSS như sau:

– Bước 1: Click Analyze > General Linear Model > Univariate…

– Bước 2: Trong hội thoại Univariate, chúng ta chuyển biến phụ thuộc “Diemgiaotiep” vào hộp Dependent Variable, chuyển biến “gioitinh”“khuvuc” vào hộp Fixed Factor(s).

– Bước 3: Để thực hiện giải thích hiệu ứng tương tác, hãy nhấp vào nút Plots… và một cửa sổ Univariate: Profile Plots sẽ xuất hiện. Cửa sổ hội thoại này muốn biết yếu tố nào cần biểu diễn trên trục hoành và yếu tố nào biểu diễn bằng cách vẽ hai đường. về mặt kỹ thuật, yếu tố nào được đặt ở đâu không quan trọng, nhưng việc sử dụng các dòng riêng biệt cho giới tính sẽ dễ dàng so sánh dữ liệu hơn. Do đó, chuyển “gioitinh” vào hộp Separate Lines và chuyển “khuvuc” đến hộp Horizontal Axis, rồi nhấp vào Add. Bây giờ bạn sẽ thấy “khuvuc*gioitinh” đã được thêm vào ngăn Plots ở cuối cửa sổ này. Sau đó nhấp vào Continue.

          – Bước 4: Nhấp vào Option…, một hộp thoại Univariate: Options xuất hiện. Đầu tiên, chúng ta thiết lập tính toán trung bình cận biên cho các hiệu ứng chính và trung bình hiệu ứng tương tác. Chúng ta di chuyển các yếu tố “gioitinh”, “khuvuc”, “khuvuc*gioitinh” vào ngăn Display Means for ở bên phải, nhấp vào hộp Compare main effects. Tuy nhiên, các trung bình này sẽ chỉ chính xác nếu có kích thước mẫu bằng nhau trong cả bốn ô. Chúng ta nhấp cả vào hộp Descriptive statistics để hiển thị đầy đủ các thông tin mô tả, chẳng hạn độ lệch chuẩn. Ngoài việc xác định xem các biến độc lập có mang lại sự khác biệt đáng kể trong biến phụ thuộc hay không (sẽ được đánh giá bằng giá trị F), các nhà nghiên cứu thường cũng muốn biết sự khác biệt lớn như thế nào. Để thực hiện việc này, hãy chọn hộp Estimates of effect size. Sau đó, nhập vào hộp Homogeneity tests để kiểm tra tính đồng biến của dữ liệu. Cuối cùng nhấp vào nút Continue ở cuối cửa sổ này.

          – Bước 5: Trong hộp thoại Univariate, chúng ta nhấp vào nút OK để chạy kết quả.

 

Phân tích kết quả:

Bảng Thống kê Mô tả (Descriptive Statistics) trình bày giá trị trung bình biên của điểm từ vựng cho hai tác động chính, trung bình ô cho sự tương tác, cũng như độ lệch chuẩn và kích thước mẫu.

Các trung bình cận biên tổng thể đối với học sinh nam so với nữ được đánh dấu bằng màu xanh lam và trung bình cận biên cho khu vực thành thị và nông thông được đánh dấu bằng màu xanh lục. Cuối cùng, các trung bình ô liên quan đến tương tác được đánh dấu bằng màu đỏ. Tuy nhiên, trước khi chúng ta có thể tìm hiểu những trung bình này, chúng ta phải kiểm tra kết quả của ANOVA được hiển thị trong bảng Tests of Between-Subjects Effects.

          Bảng kiểm định phương sai bằng nhau “Levene’s Test of Equality of Error Variances” cung cấp kiểm định về kết quả định bằng nhau của phương sai. Chúng ta mong muốn hệ số significant lớn hơn 5% và do đó không có ý nghĩa thống kê, như thế có thể kết luận được phương sai giữa các nhóm biến bằng nhau. Điều này là đúng trong trường hợp này.

Bảng Tests of Between-Subjects Effects cột quan trọng nhất trong bảng này là ba cột cuối cùng, trình bày các giá trị F, mức ý nghĩa (Sig.), và chỉ số kích thước hiệu ứng (Partial Eta Squared). Bảng này trình bày các bài kiểm tra về hai hiệu ứng chính và hiệu ứng tương tác. Những giá trị p<0.05 cho thấy rằng hiệu ứng giới tính và tác động tương tác (gioitinh*khuvuc) đều có ý nghĩa thống kê, trong khi hiệu ứng khu vực không có ý nghĩa thống kê (p>0.05). Giá trị Fgioitinh (df 1, 16) = 6.041 lớn hơn giá trị F tới hạn là 4.49 (tra trong Bảng phân phối F), Giá trị Fgioitinh*khuvuc (df 1, 16) = 6.041 lớn hơn giá trị F tới hạn là 4.49 cho thấy hiệu ứng giới tính và hiệu ứng tương tác đến điểm giao tiếp của học sinh ở mức ý nghĩa alpha = 5%.

Vì hiệu ứng “giới tính” là có ý nghĩa đáng kể cho điểm giao tiếp của học sinh nên chúng ta cần phân tích sâu hơn hiệu ứng này, trong khi bỏ qua hiệu ứng khu vực. Trong bảng Pairwise Compairsons của phần giới tính cho thấy giá trị p=0.026<0.05 biểu lộ sự khác biệt giữa học sinh nam (mean=16.30, SD=2.50) và học sinh nữ (mean=18.4, SD=1.65) với điểm giao tiếp tiếng Anh. Sự khác biệt điểm trung bình giữa hai nhóm là 2.100 điểm với khoảng tin cậy từ 0.289 đến 3.911. Khoảng tin cậy là không chứa giá trị 0 nên khẳng định chắc chắn sự khác biệt là có ý nghĩa.

Trong bài trước, chúng tôi đã giới thiệu các thiết kế One-way ANOVA liên quan đến nhiều cấp độ của một biến (hoặc nhân tố) độc lập. Bài này sẽ giới thiệu một mô hình ANOVA phức tạp hơn cho phép nhà nghiên cứu kiểm tra hiệu ứng của hai biến độc lập; do đó, thủ tục này được gọi là ANOVA hai chiều . . .

This content is restricted to subscribers


* Lưu ý: Bạn sẽ không thể đọc tài liệu nếu bạn chưa trả phí hoặc gói tài liệu trả phí của bạn đã hết hạn. Vui lòng đăng ký tài khoản Premium tại đây.

Tài liệu tham khảo

  1. Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
  3. Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

admin

Chịu trách nhiệm học thuật, PGS.TS. Nguyễn Văn Hạnh
Chuyên gia nghiên cứu Khoa học Giáo dục và Phân tích định lượng.

error: Content is protected !!
0
Would love your thoughts, please comment.x
()
x