Bài 3. Chọn một bài kiểm tra thống kê

admin
10760 15 phút đọc

3. Thiết kế nghiên cứu

Việc chọn một bài kiểm tra thống kê thích hợp phụ thuộc vào việc liệu các mẫu của các quan sát là độc lập hay liên quan với nhau. Nói chung, thiết kế một phép đo liên quan được ưu thế hơn thiết kế một mẫu độc lập vì về mặt thống kê có ít bậc tự do hơn. Do đó, ý nghĩa thống kê đạt được, ở mức p xác định, với sự khác biệt nhỏ hơn. Ngoài ra, một lợi ích thiết thực là ít đối tượng được yêu cầu hơn và sự khác biệt riêng lẻ giữa các điều kiện có thể được loại bỏ. Một nhược điểm là cần phải cân bằng các hiệu ứng thứ tự có thể có và sự yêu cầu về khoảng thời gian rửa trôi giữa các lần đo. Các hiệu ứng của phép đo hoặc tham gia trong một thí nghiệm có thể bị mang sang lần đo thứ hai. Có một số thiết kế phải sử dụng các mẫu độc lập, ví dụ, trong cuộc điều tra về sự khác biệt giữa trẻ em trai và trẻ em gái về kỹ năng ứng phó của họ trong các thiết lập môi trường xã hội khác nhau.

Các thiết kế nghiên cứu được tóm tắt dưới đây.

Một mẫu (One sample) Khi một mẫu quan sát ngẫu nhiên duy nhất là thu được từ một dân số xác định.
Hai mẫu (Two samples) Thiết kế này có thể có hai dạng:

  • Khi hai mẫu quan sát ngẫu nhiên độc lập là thu từ một dân số xác định.
  • Khi hai mẫu quan sát là thu được từ cùng các cá nhân giống nhau (có liên quan).
Nhiều mẫu (Multiple samples) Khi có nhiều hơn hai mẫu quan sát. Các thiết kế này có thể được tách thành hai loại tùy thuộc vào số lượng các biến độc lập (nhân tố):

  • Khi chỉ có một biến độc lập với các mức độ (phân loại) khác nhau tạo thành các nhóm và một biến phản ứng.
  • Khi có nhiều hơn một biến độc lập (nhân tố) và một biến phản ứng, tức là hai biến độc lập với hai (hoặc nhiều hơn) các mức độ (phân loại) tạo thành các nhóm. Ví dụ, một thiết kế 2 × 2 sẽ là hai biến độc lập, mỗi biến có hai mức độ tạo thành bốn nhóm.

4. Phân phối dữ liệu

Các phân phối dữ liệu có thể được phân loại thành: 1) nhị thức / danh nghĩa; 2) xếp hạng; và 3) liên tục. Các phân phối này có các mô hình xác suất cơ bản khác nhau và có thể được coi là ba loại thống kê riêng biệt.

Khi dữ liệu là nhị thức, tất cả các giá trị dữ liệu được phân loại thành chỉ một trong hai giá trị duy nhất có thể có, điều này đôi khi được gọi là dữ liệu nhị phân. Dữ liệu danh nghĩa là khi các giá trị dữ liệu có thể được phân loại thành hai hoặc nhiều nhóm. Nó có thể được coi là sự mở rộng của tình huống nhị thức. Một thống kê hữu ích cho dữ liệu loại danh nghĩa là thống kê χ2 dựa trên phân phối χ2.

Nếu một biến phản hồi là thứ tự xếp hạng, hoặc phân phối của một biến liên tục là không đối xứng, thì biến liên tục có thể được xử lí như một biến xếp hạng, và thống kê phi tham số (nonparametric) và phân phối tự do nên được xem xét. Loại thống kê này đưa ra rất ít giả định về phân phối. Loại thống kê này đưa ra rất ít giả định về phân phối. Tất cả những gì yêu cầu cho một số bài kiểm tra là các điểm số có thể được xác định như là khác biệt, các yêu cầu kiểm tra khác là điểm số hoặc giá trị có thể được xếp hạng.

Khi dữ liệu là chuẩn, thì theo đó các điểm số phải có một giá trị trung bình (mean) và một độ lệch chuẩn (standard deviation). Nếu một giá trị trung bình hoặc một độ lệch chuẩn không có lý, chẳng hạn như một độ lệch chuẩn “0.6”, thì có thể bạn đang áp dụng một phép đo liên tục khi không nên. Rõ ràng, giá trị “0.6” thể hiện một giá trị danh nghĩa và rời rạc.

5. Tóm tắt quyết định kiểm tra thống kê

Sự kết hợp ba tiêu chí chính bao gồm: câu hỏi nghiên cứu, thiết kế nghiên cứu, và phân phối dữ liệu đưa đến một bảng tóm tắt cho việc chọn bài kiểm tra thống kê dưới đây.

Thiết kế Suy luận thống kê
  Dữ liệu đếm (rời rạc) Dữ liệu liên tục
Một mẫu (One Sample) Nhị thức/ danh nghĩa Xếp hạng Chuẩn/ liên tục
Câu hỏi nghiên cứu: Mối quan hệ/ liên kết Kiểm tra χ2 một mẫu về tính độc lập Tương quan thứ tự xếp hạng Spearman Tương quan Pearson
Sự khác biệt Kiểm tra nhị thức (Binomial test) One sample Runs test
Dự đoán

(Biến độc lập là liên tục)

Hồi quy tuyến tính
(Biến phản ứng là liên tục)
Hai mẫu (Two sample) Independent Related Independent Related Independent Related
So sánh/ Sự khác biệt Kiểm tra Fisher
exact
Kiểm tra dấu Kiểm tra Mann-Whitney U Kiểm tra dấu hạng Wilcoxon t-test độc lập t-test bắt cặp
Sự liên kết (các biến phân lớp là rời rạc hình thành các nhóm) Kiểm tra χ2 mẫu r×2 cho tính đồng nhất
Nhiều mẫu (một nhân tố/biến độc lập) Independent Related Independent Related Independent Related
Sự khác biệt giữa các nhóm (các biến phân lớp là rời rạc hình thành các nhóm) Kruskal Wallis One-way
ANOVA
Friedman
ANOVA
ANOVA một chiều (không liên quan) ANOVA một chiều (liên quan)
Nhiều mẫu (Hai nhân tố/ nhiều biến độc lập)
Sự khác biệt giữa các nhóm (các biến phân lớp là rời rạc hình thành các nhóm) Cochran’s Q test ANOVA hai chiều
(không liên quan)
Split-Plot ANOVA
Sự liên kết giữa các nhóm (các biến phân lớp là rời rạc hình thành các nhóm) r×k χ2 test

 

Trong bảng này, trước tiên, chúng ta nên xem xét thiết kế nghiên cứu và các câu hỏi nghiên cứu. Cột thiết kế được chia thành các câu hỏi nghiên cứu, các hàng giới thiệu về các thiết kế một mẫu và câu hỏi nghiên cứu liên quan đến mối liên hệ, sự khác biệt, dự đoán, so sánh; thiết kế hai mẫu và các câu hỏi nghiên cứu liên quan đến các so sánh / khác biệt và các liên kết; hàng cuối cùng là các loại thiết kế nhiều mẫu liên quan đến các câu hỏi về sự khác biệt và liên kết giữa các mẫu.

Dọc theo cột “suy luận thống kê” gồm có hai cột chính là dữ liệu đếm và dữ liệu liên tục. Cột dữ liệu đếm được chia nhỏ hơn thành các suy luận liên quan đến dữ liệu nhị thức / danh nghĩa; các suy luận liên quan đến dữ liệu được xếp hạng; và các suy luận liên quan đến dữ liệu chuẩn. Tương ứng với ba loại phân phối dữ liệu, nhị thức / danh nghĩa, thứ hạng và chuẩn là các bài thống kế được sử dụng. Đối với một số thiết kế, ba loại phân phối dữ liệu này được chia thành các các phép đo độc lập và liên quan. Điều này cho tổng cộng sáu cột: nhị thức độc lập / liên quan; được xếp hạng độc lập / liên quan; và chuẩn liên tục độc lập / liên quan.

Để quyết định một bài kiểm tra thống kê thích hợp, hãy bắt đầu ở đầu cột thiết kế và di chuyển xuống xuống dưới cho đến khi bạn đạt được câu hỏi thiết kế và nghiên cứu phù hợp với thiết kế nghiên cứu của bạn. Sau đó, bạn dừng lại khi hàng giao nhau với một cột tiêu đề thích hợp liên quan đến loại dữ liệu tương ứng, ví dụ: nhị thức / danh nghĩa; xếp hạng hoặc phân phối dữ liệu chuẩn. Đối với một số thiết kế, bạn cần phải chọn giữa một thước đo độc lập hoặc liên quan cho biến phản hồi. Từ đó, một (các) bài thống kê được lựa chọn.

1. Giới thiệu chung
Làm thế nào để chọn một bài kiểm tra thống kê để rút ra kết luận mới từ dữ liệu mẫu?

Vấn đề đối với một nhà nghiên cứu mới khi lựa chọn một bài kiểm tra thống kê là thiếu kinh nghiệm với các bài thống kê được áp dụng. Họ có thể đã học một khóa h . . .

This content is restricted to subscribers


* Lưu ý: Bạn sẽ không thể đọc tài liệu nếu bạn chưa trả phí hoặc gói tài liệu trả phí của bạn đã hết hạn. Vui lòng đăng ký tài khoản Premium tại đây.

Tài liệu tham khảo

  1. Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
  3. Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

admin

Chịu trách nhiệm học thuật, PGS.TS. Nguyễn Văn Hạnh
Chuyên gia nghiên cứu Khoa học Giáo dục và Phân tích định lượng.

error: Content is protected !!
0
Would love your thoughts, please comment.x
()
x