Bài 6. Chi-bình phương r×k (r×k Chi-square Test)

admin
6815 6 phút đọc

1. Khi nào sử dụng?

Bài kiểm tra này là phần mở rộng của χ2 mẫu r × 2 về tính đồng nhất khi có nhiều hơn hai nhóm (mẫu) độc lập, hoặc χ2 một mẫu về tính độc lập khi có nhiều hơn hai loại trong biến hàng hoặc cột. Trong thiết kế đồng nhất, k mẫu ngẫu nhiên độc lập được lấy ra (biến cột), và phân phối tỷ lệ trong các loại r (biến hàng) được so sánh, do đó có thuật ngữ r × k Chi-square.

Đối với thiết kế đồng nhất, nhà nghiên cứu sẽ quan tâm đến hiệu ứng của biến cột lên biến phản hồi (biến hàng). Đối với thiết kế độc lập, nhà nghiên cứu sẽ quan tâm đến việc kiểm tra xem hai biến phân loại có độc lập hay không.

2. Suy luận thống kê và giả thuyết vô hiệu

Đối với thiết kế đồng nhất, dạng tổng quát của giả thuyết vô hiệu là k mẫu độc lập đến từ một dân số duy nhất (hoặc các quần thể giống hệt nhau). Điều này có thể được phát biểu vì tỷ lệ các đối tượng trong mỗi loại của biến hàng là như nhau trong mỗi ô của k nhóm độc lập (biến cột). Các tham số được ước lượng là các tỷ lệ trong mỗi ô của bảng phát sinh. Biến cột mô tả k dân số được quan sát, và biến hàng là biến phản hồi phân loại. Giả thuyết nghiên cứu là sự phân phối tỷ lệ cho một biến phân loại (biến hàng) là khác nhau trong k dân số (biến cột). Để kiểm tra giả thuyết vô hiệu, chúng ta so sánh số lượng ô quan sát được (observed cell) với số lượng ô kì vọng (expected cell) ​​với giả định rằng không có sự khác biệt về tỷ lệ. Đối với χ2 về tính độc lập, giả thuyết vô hiệu là hai biến phân loại là độc lập. Giả thuyết thay thế là có một mối quan hệ giữa các biến hàng và cột. Trong bất kể thiết kế nào, mỗi đối tượng chỉ được xuất hiện trong một ô trong bảng phát sinh.

3. Các giả định kiểm tra

Các giả định của Chi-bình phương r×k tương tự như χ2 hai mẫu (xem bài kiểm tra Chi-bình phương hai mẫu) ngoại trừ việc ít nhất một trong các biến phân loại có từ ba loại trở lên.

4. Thủ tục kiểm tra χ2 r × k

Tính toán thống kê χ2 r × k tương tự như quy trình kiểm tra χ2 hai mẫu. Trong mỗi ô, χ2 được tính bằng hiệu số giữa tần suất quan sát được và tần suất kỳ vọng tương ứng được bình phương và sau đó chia cho tần suất kỳ vọng (O-E)2 / E. Giá trị χ2 tổng cho bảng phát sinh là tổng các giá trị χ2 được tính cho mỗi ô. Bậc tự do được tính bằng (hàng-1 × cột-1).

Ví dụ, chúng ta cần đánh giá xem liệu giới tính và GPA của các sinh viên đại học có quan hệ với nhau không. Một tập dữ liệu gồm 654 sinh viên được thu thập. Biến giới tính (biến hàng) được chia làm các mức giá trị 1 = nam, 2 = nữ, và biến GPA (biến cột) được chia làm các mức giá trị 1= 1 đến 1.99, 2 = 2 đến 2.49, 3 = 2.5 đến 3.19, 4 = 3.2 đến 4.

Giả thuyết thống kê H0: Không có mối quan hệ giữa yếu tố giới tính và GPA của các sinh viên? Mức alpha được chọn là 5%.

Dữ liệu khảo sát đếm tần suất được trình bày trong bảng dưới đây:

GPA

1 đến 1.99 2 đến 2.49 2.5 đến 3.19 3.2 đến 4 Total
Male 62 (A) 209 (B) 157 (C) 33 (D) 461
Female 15 (E) 73 (F) 84 (G) 21 (H) 193
Total 77 282 241 54 654

Các bước kiểm tra χ2 mẫu r × k:

Bước 1: Tính giá trị kì vọng cho mỗi ô từ A đến H

  •  ô A: EA= (77×461)/654 = 54.28
  •  ô B: EB= (25×30)/654 = 198.78
  •  ô C: EC= (25×20)/ 654 = 169.88
  •  ô D: ED= (25×20)/ 654 = 38.06
  •  ô E: EE= (77×461)/654 = 22.72
  •  ô F: EF= (25×30)/654 = 83.22
  •  ô G: EG= (25×20)/ 654 = 71.12
  •  ô H: EH= (25×20)/ 654 = 15.94

Bước 2: Tính giá trị χ2 cho mỗi ô từ A đến H

  •  ô A: χ2 = (62 – 54.28)2/ 54.28 = 1.098969
  •  ô B: χ2 = (209 – 198.78)2/ 198.78 = 0.525467
  •  ô C: χ2 = (157 – 169.88)2/ 169.88 = 0.976423
  •  ô D: χ2 = (33 – 38.06)2/ 38.06 = 0.673765
  •  ô A: χ2 = (15 – 22.72)2/ 22.72= 2.624998
  •  ô B: χ2 = (73 – 83.22)2/ 83.22 = 1.25513
  •  ô C: χ2 = (84 – 71.12)2/ 71.12 = 2.332284
  •  ô D: χ2 = (21 – 15.94)2/ 15.94 = 1.609355

Bước 3: Tính tổng tất cả χ2 (đã làm tròn số)

  • Tổng χ2 = 1.099 + 0.526 + 0.976 + 0.674 + 2.625 + 1.255 + 2.332 + 1.609 = 11.096
  • Bậc tự do df = (hàng-1 × cột-1) = (2-1) × (4-1) = 3

Cách suy luận kết quả: Tra bảng phân phối các giá trị χ2 tới hạn (vui lòng xem bảng phân phối χ2), mức alpha được chọn đầu tiên là p≤0.05, giá trị χ2 tới hạn là 7.815, là giao điểm của cột alpha ở 0.05 và hàng df là 3. Vì giá trị χ2 được tính toán (11.096) là lớn hơn giá trị χ2 tới hạn nên chúng ta có thể bác bỏ giả thuyết vô hiệu và kết luận rằng hai biến số, là GPA và giới tính là liên quan với nhau. Tuy nhiên, sư liên quan này là nhỏ (Cramer’s V = 0.011, tức 1.1% sự tương tác với nhau).

 

5. Kiểm tra Chi-bình phương r×k trong SPSS

Trong SPSS, chúng ta thực hiện theo tiến trình sau:

Bước 1. Vào Analyze > Descriptives Statistics > Crosstabs…

Bước 2. Tại hộp thoại Crosstabs, đưa biến giới tính vào ô Row(s) và biến GPA vào ô Column(s). Chúng ta có thể nhấp vào ô Display clustered bar charts để hiện đồ thị mối quan hệ hai biến.

Bước 3. Nhấp vào tùy chọn Statistics, chọn vào Chi-square, Phi and Cramer’s V, Contingency coefficient. Sau đó nhấp nút Continue.

Bước 4. Nhấp vào tùy chọn Cells, chọn Observed, ExpectedTotal. Về ý nghĩa thì Observed là số lượng thực tế quan sát, Expected là số lượng kì vọng, Total là tổng phần trăm theo từng dòng và từng cột. Nếu cần hiển thị thêm giá trị % của các ô, chúng ta chọn thêm RowColumn. Sau đó nhấp nút Continue.

Bước 5. Nhấn OK để chạy kết quả.

Cách đọc kết quả:

Việc đọc kết quả thống kê Crosstabulation tương tự như Bài 1 – kiểm tra Chi-bình phương.

Bảng kết quả quan trọng nhất là Chi-square test. Giá trị Asymptotic Significance (2-sided) = 0.011 chính là p (2 đuôi) của χ2. Không có ô nào trong bảng phát sinh có tần suất kỳ vọng (expected) nhỏ hơn 5 nên giá trị χ2 là đáng tin cậy. Nếu trên 20% bạn phải tính đến các biện pháp khác, như là sử kiểm tra Fisher’s exact test.

Giá trị χ2 là 11.096, giá trị bậc tự do df là 3, giá trị p (2-sided) là 0.011. Do p < 0.05 nên có bằng chứng cho thấy hai biến này không độc lập với nhau. Do đó kết luận rằng có mối quan hệ giữa yếu tố GPA và giới tính của các sinh viên. Chúng ta tiếp tục tra bảng phân phối χ2, kết quả cho thấy giá trị χ2 tính toán “11.096” là lớn hơn giá trị χ2 tới hạn “7.815” ở mức ý nghĩa 0.05 cho thấy bằng chứng chắc chắn về mối quan hệ giữa GPA và giới tính của các sinh viên. Nhưng mối quan hệ này là nhỏ do Cramer’s V = 0.011 (tức 1.1% có sự tương quan).

Tài liệu tham khảo

  1. Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
  3. Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

admin

Chịu trách nhiệm học thuật, PGS.TS. Nguyễn Văn Hạnh
Chuyên gia nghiên cứu Khoa học Giáo dục và Phân tích định lượng.

error: Content is protected !!
0
Would love your thoughts, please comment.x
()
x