Bài 5. Kiểm tra dấu (Sign Test)

admin
3089 7 phút đọc

1. Khi nào sử dụng?

Bài kiểm tra dấu các mẫu được khớp cặp thường được sử dụng để xác định xem liệu có sự khác biệt trung vị giữa các quan sát được khớp cặp hoặc bắt cặp hay không. Bài kiểm tra này có thể được coi là một phương pháp thay thế cho phép thử t bắt cặp (paired-samples t-test) hoặc kiểm tra dấu hạng Wilcoxon khi sự phân phối của sự khác biệt giữa các quan sát bắt cặp là không phải là chuẩn hoặc đối xứng. Thông thường, những người tham gia được kiểm tra tại hai thời điểm hoặc trong hai điều kiện khác nhau trên cùng một biến phụ thuộc liên tục. Tuy nhiên, có thể có hai nhóm người tham gia khác nhau như một phần của thiết kế nghiên cứu “khớp nối cặp”. Ví dụ, chúng ta có thể sử dụng bài kiểm tra dấu để biết liệu có sự khác biệt trung vị trong việc tiêu thụ thuốc lá hàng ngày của người hút thuốc trước và sau chương trình trị liệu thôi miên 6 tuần hay không (nghĩa là, biến phụ thuộc của bạn sẽ là “mức tiêu thụ thuốc lá hàng ngày”, với hai thời gian điểm là “trước” và “sau” chương trình thôi miên).

2. Suy luận thống kê và giả thuyết vô hiệu

Các suy luận cho bài kiểm tra dấu các cặp trùng khớp liên quan đến trung vị dân số (η, gọi là eta) của các sự khác biệt. Giả thuyết vô hiệu là giá trị trung vị của các sự khác biệt là 0 (tương tự như phép thử t-test bắt cặp (paired t-test) khi giá trị trung bình (mean) của các sự khác biệt là 0). Khi xác suất của một + là 0.5 bởi sự tình cờ, sẽ có một số tương đương + và – khác biệt trên và dưới trung vị và do đó chênh lệch trung vị là 0. Ở dạng ký hiệu H0: η = 0. Giả thuyết thay thế có thể là một phía, tức là H1: η> 0 (chênh lệch trung vị là dương, dấu + nhiều hơn -) hoặc H1: η <0 (chênh lệch trung vị là âm, dấu – nhiều hơn +). Giả thuyết thay thế hai phía sẽ là H1: η ≠ 0 (trung vị là ≠ 0, số dấu + và – khác nhau).

3. Giả định kiểm tra

Kiểm tra dấu (các cặp trùng khớp) được áp dụng khi:

  • Biến phản hồi được phân tích có phân phối liên tục (hoặc ít nhất là liên tục theo lý thuyết).
  • Dữ liệu ở dạng số lượng tần suất của sự khác biệt + và -.
  • Mỗi cặp quan sát là độc lập với các quan sát khác.

4. Thủ tục kiểm tra dấu

Ví dụ: chúng ta có thể đã đo lường mức lương của 15 người tham gia bằng VNĐ (tức là biến phụ thuộc) trước và sau khi họ lấy bằng thạc sĩ để xem xét liệu có sự cải thiện mức lương của họ (tức là, hai “mốc thời gian” mà mức lương của người tham gia được đo lường – “trước” và “sau” khóa học thạc sĩ – phản ánh hai “nhóm liên quan”- cặp trùng khớp của biến độc lập). Vì những người tham gia giống nhau được đo tại hai thời điểm này nên các nhóm có liên quan với nhau. Các nhóm liên quan cũng thường phản ánh hai điều kiện khác nhau mà tất cả những người tham gia phải trải qua (tức là những điều kiện này đôi khi được gọi là can thiệp, điều trị hoặc thử nghiệm).

Bài kiểm tra dấu đã được sử dụng và alpha được đặt thành 5%, với bài kiểm tra hai phía. Giả thuyết vô hiệu là không có sự khác biệt về mức lương của người tham gia. Giả thuyết thay thế là mức lương của người tham gia trức và sau chương trình thạc sĩ MBA là khác nhau.

Dữ liệu được thu thập về mức lương trước và sau khi học chương trình thạc sĩ MBA được tổng hợp trong bảng dưới đây:

Trong 15 người tham gia, có 10 khác biệt dương, 2 khác biệt âm và 3 không khác biệt. Nếu giả thuyết vô hiệu là đúng, rằng không có sự khác biệt về mức lương trước và sau chương trình MBA, thì số chênh lệch dương dự kiến là 6/12 (do loại trừ 3 điểm không khác biệt).

Bởi vì thử nghiệm có hai mặt, kết quả là cực trị hoặc nhiều hơn 10 khác biệt dương bao gồm kết quả của 10, 11 hoặc 12 khác biệt dương và kết quả của 0, 1 hoặc 2 khác biệt dương. Xác suất có 10 điểm dương (+) trở lên trong số 12 người tham gia hoặc từ 2 điểm dương trở xuống trong số 12 người tham gia bằng xác suất của 10 người trở lên hoặc 2 người trở xuống trong 12 lần lật đồng xu công bằng. Xác suất có thể được tính bằng phân phối mẫu nhị thức (binomial sample distribution), với xác suất đầu = xác suất sấp = 0.5, với n = 12. Vì vậy, chúng ta có thể tra cứu bảng phân phối mẫu nhị thức từng xác suất trong tất cả trường hợp và cộng chúng lại:

  •  Xác suất xuất hiện 0 đầu trong 12 lần lật đồng xu công bằng = 0.000
  •  Xác suất xuất hiện 1 con đầu trong 12 lần lật đồng xu công bằng = 0.003
  •  Xác suất xuất hiện 2 đầu trong 12 lần lật đồng xu công bằng = 0.016
  •  Xác suất xuất hiện 10 đầu trong 12 lần lật đồng xu công bằng = 0.016
  •  Xác suất xuất hiện 11 đầu trong 12 lần lật đồng xu công bằng = 0.003
  •  Xác suất 12 đầu trong 12 lần lật đồng xu công bằng = 0.000

Xác suất hai phía của một kết quả có cực trị bằng 10/12 chênh lệch dương là tổng các xác suất sau:

0.000 + 0.003 + 0.016 + 0.016 + 0.003 + 0.000 = 0.038

Nhận xét: xác suất quan sát được một kết quả là cực trị với 10 trong số 12 sự khác biệt dương về mức tiền lương sau so với trước chương trình MBA, nếu không có sự khác biệt về tiền lương trước – sau chương trình MBA, là p = 0.038. Giả thuyết vô hiệu bị bác bỏ với mức ý nghĩa p = 0.05, và kết luận rằng có sự khác biệt về mức lương trước và sau chương trình MBA.

Nếu kiểm tra một phía, giả thuyết thay thế là mức tiền lương sau chương trình MBA là cao hơn mức tiền lương trước khi tham gia chương trình MBA.

Xác suất của một kết quả cực trị là 10 điểm dương có lợi cho mức lương sau trong 12 cặp, nếu giả thuyết vô hiệu là đúng, liệu rằng mức lương sau cao hơn mức lương trức trong chương trình MBA? Đây là xác suất của 10 mặt trở lên trong 12 lần lật của một đồng xu công bằng và có thể được tính bằng cách sử dụng phân phối nhị thức với p (đầu) = p (đuôi) = 0.5.

Nhận xét: Xác suất p (của 10, 11 hoặc 12 đầu trong 12 lần lật của đồng xu công bằng) = 0.000 + 0.003 + 0.016 = 0.019. Giả thuyết vô hiệu bị bác bỏ và chúng ta kết luận rằng mức lương sau cao hơn mức lương trức trong chương trình MBA.

 

5. Kiểm tra dấu trong SPSS

Các bước tiến hành kiểm tra dấu trong thống kê SPSS:

Bước 1. Click Analyze > Nonparametric Tests > Legacy Dialogs > 2 Related Samples…

Bước 2. Trong hộp thoại Two-Related-Samples Tests, chúng ta chuyển các biến vào hộp Test Pairs, trong đó biếnlương trướcchuyển vào hộp Varable 1, biến “lương sau”chuyển vào hộp Variable2. Bỏ chọn Wilcoxon và chọn Sign trong vùng Test Type. Sau đó nhấp vào OK để chạy kết quả.

SPSS sẽ tạo ra hai bảng kết quả chính cho một bài kiểm tra dấu.

– Trong bảng Frequencies, bạn có thể thấy có 2 người lương giảm (hàng “Negative Differences“), 10 người lương tăng (hàng “Positive Differences”), và 3 người không có sự thay đổi về lương (hàng “Ties“) sau khi tham gia chương trình thạc sĩ MBA.

– Trảng bảng Test Statistics, ý nghĩa thống kê, p (2 đuôi) của kiểm tra dấu được tìm thấy trong hàng Exact Sig. (2-tailed). Tuy nhiên, nếu bạn có hơn tổng cộng 25 khác biệt âm và dương, thì hàng ” Asymp. Sig. (2-sided test) ” sẽ được hiển thị thay thế. Chúng ta sẽ cần kiểm tra hạng dấu nâng cao, sẽ trình bày trong một bài khác.

=> Viết báo cáo kết quả từ kiểm tra dấu, có thể là: Có 30 người tham gia đã được mời để điều tra về mức lương của họ trước và sau chương trình thạc sĩ MBA. Một bài kiểm tra dấu chính xác (exact sign test) đã được sử dụng để so sánh sự khác biệt về mức lương trong hai trình độ học vấn. Kết quả hiển thị mức lương sau chương trình MBA đã tạo ra sự gia tăng trung vị có ý nghĩa thống kê so với mức lương trước chương trình MBA, p = 0.039 (2 đuôi).

Có thể thấy, giá trị kiểm tra dấu trong phân tích SPSS (p=0.039) là bằng giá trị tính tay (p=0.038) trong ví dụ trên. Sự khác biệt rất nhỏ là do phép làm tròn số trong khi tính tay.

Tài liệu tham khảo

  1. Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
  3. Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

admin

Chịu trách nhiệm học thuật, PGS.TS. Nguyễn Văn Hạnh
Chuyên gia nghiên cứu Khoa học Giáo dục và Phân tích định lượng.

error: Content is protected !!
0
Would love your thoughts, please comment.x
()
x