Bài 2. Cơ sở phân tích dữ liệu ban đầu cho lựa chọn bài kiểm tra thống kê

admin
5282 4 phút đọc

Một nghiên cứu định lượng thường dựa trên các nghiên cứu thực nghiệm trước đây và hoặc các cân nhắc lý thuyết, một trong số đó có thể đề xuất một loại mô hình thống kê khả thi cho dữ liệu của bạn. Các mô hình thống kê phổ biến với các nhà nghiên cứu giáo dục hoặc tâm lý, thường là ba loại mô hình chính: (1) mô hình tham số tổng quát dựa trên phân phối xác suất chuẩn (có thể bao gồm t-test, F-test, Pearson r); (2) mô hình nhị thức dựa trên phân phối nhị thức (có thể bao gồm các kiểm tra nhị thức và kiểm tra dấu); và (3) các thủ tục phân phối tự do (liên quan đến các thử nghiệm thống kê phi tham số). Các lớp mô hình khác ít gặp hơn bao gồm các mô hình Poisson, Hypergeometric (phân phối rời rạc), và Exponential, Gamma và Weibull (phân phối liên tục).

Ngay cả khi một mô hình thống kê khả thi được xác định bởi sự tiên nghiệm từ các xem xét lý thuyết hoặc các nghiên cứu thực nghiệm trước đó, các phân tích dữ liệu ban đầu cũng nên được sử dụng để kiểm tra cấu trúc của dữ liệu và xác định xem các biến là rời rạc hay liên tục, từ đó xác nhận các mô hình thống kê cơ bản hợp lý, chẳng hạn như phân phối nhị thức, phân phối chuẩn, phân phối chuẩn nhiều chiều. Thông lệ tốt là sử dụng càng nhiều dữ liệu có liên quan càng tốt và không thu gọn (gộp) các biến và như vậy đã chuyển đổi chúng xuống các mức đo lường thấp hơn.

Các quan sát ngoại lệ (dị biệt) có thể có tác động mạnh mẽ đến các thử nghiệm thống kê. Ví dụ, t-test nhạy cảm với các quan sát ngoại lệ, đặc biệt là với các cỡ mẫu nhỏ. Khi điều chỉnh dữ liệu với một mô hình thống kê, những hiệu ứng của sự bao hàm và loại trừ các ngoại lệ nên được kiểm tra.

Biểu đồ phân tán (Scatterplots) của một biến này so với một biến khác sẽ chỉ ra trực quan mức độ quan hệ giữa hai biến và liệu nó có tuyến tính hay không. Độ tuyến tính là một giả định cần thiết cho một số bài kiểm tra thống kê, chẳng hạn như hồi quy tuyến tính và tương quan. Các biểu đồ Histograms và stem – leaf plots cung cấp thông tin về sự phân phối của các biến và các giá trị thống kê kiểm tra các giả định về tính chuẩn, liệu một biến có được phân phối chuẩn trong dân số hay không, xin đọc bài phân phối chuẩn.

Một sự hiểu lầm chung giữa các nhà nghiên cứu mới rằng một biến tiêu chí của sự quan tâm phải đạt được phân phối chuẩn trong mẫu. Ví dụ, trong một bài kiểm tra t-test hai mẫu (two sample t-test), người ta thường tin rằng biến tiêu chí phải được phân phối chuẩn trong hai mẫu. Cái này không cần thiết. Mô hình tham số tổng quát đưa ra giả định rằng biến (hay chính xác hơn là các sai số) được phân phối chuẩn trong dân số (không nhất thiết phải có trong mẫu). Quan trọng hơn là tính đồng nhất của phương sai trong cả hai mẫu. Các kiểm tra này thường ở dạng các đồ thị phần dư. Phần dư thể hiện sự khác biệt giữa giá trị quan sát được và giá trị kỳ vọng dựa trên mô hình thống kê được sử dụng.

Trong phần lớn các báo cáo khoa học, các giả định kiểm tra thống kê thường vắng mặt. Có vẻ như tất cả các giả định quá thường xuyên này là được ngầm hiểu đã thực hiện, nhưng khi xem xét kỹ hơn, chúng có thể không hợp lệ và các kết luận là không hợp lệ. Ví dụ như việc cáo cáo một giá trị tương quan Pearson có ý nghĩa khi thực tế mối quan hệ là phi tuyến tính hoặc khi các biến là phân loại rõ ràng, báo cáo t-test cho các mẫu độc lập khi kích thước mẫu nhỏ, không bằng nhau và có các quan sát ngoại lệ.

Kết quả của phân tích dữ liệu ban đầu sẽ cho biết khi nào các bài kiểm tra thống kê là không cần thiết. Điển hình là khi toàn bộ dân số được đánh giá, khi trung bình của hai mẫu lớn giống hệt nhau hoặc khi các mẫu lớn của kích thước bằng nhau có khoảng tin cậy không chồng chéo cho điểm trung bình khi được vẽ biểu đồ. Các tình huống khác nghiêm trọng hơn sẽ xảy ra khi có bằng chứng về sự thiên vị, giá trị ngoại lệ và các sai số không đổi (non-constant errors) có thể do lấy mẫu ngẫu nhiên hoặc lấy mẫu phi xác suất không thỏa đáng.

Nói chung, một bộ dữ liệu không nên sử dụng để đồng thời hình thành và kiểm tra các giả thuyết. Nếu tập dữ liệu có đủ kích thước, nó có thể được phân chia ngẫu nhiên thành hai tập dữ liệu bằng nhau, một tập dữ liệu huấn luyện (training dataset) và một tập dữ liệu xác nhận (confirmatory dataset). Tập huấn luyện được sử dụng để tạo ra các giả thuyết và tập dữ liệu xác nhận được sử dụng để kiểm tra các giả thuyết này. Cần phải luôn biết rằng ý nghĩa thống kê không đồng nghĩa với ý nghĩa giáo dục. Kết quả của một bài kiểm tra thống kê chỉ là một trợ giúp cho việc ra quyết định. Ví dụ, sự khác biệt trung bình đáng kể của ba điểm trong bài kiểm tra tiếp thu từ vựng bằng các phương pháp can thiệp liên tiếp nhau, giữa hai nhóm, có thể không có nhiều ý nghĩa giáo dục khi được xem xét trong bối cảnh tăng trưởng tự nhiên trong việc tiếp thu từ vựng.

Tài liệu tham khảo

  1. Coolican, H. (2018). Research methods and statistics in psychology. Routledge.
  2. Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley & Sons.
  3. Jackson, S. L. (2015). Research methods and statistics: A critical thinking approach. Cengage Learning.
  4. McQueen, R. A., & Knussen, C. (2006). Introduction to research methods and statistics in psychology. Pearson education.
  5. Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.
  6. Wagner III, W. E. (2019). Using IBM® SPSS® statistics for research methods and social science statistics. Sage Publications.

admin

Chịu trách nhiệm học thuật, PGS.TS. Nguyễn Văn Hạnh
Chuyên gia nghiên cứu Khoa học Giáo dục và Phân tích định lượng.

error: Content is protected !!
0
Would love your thoughts, please comment.x
()
x