Bài 5. Biểu đồ Thân và Lá (Stem and Leaf), và đồ thị hộp và râu (Box and Whisker)
1. Biểu đồ Thân và Lá
Biểu đồ thân và lá là một phương tiện hữu ích để hiển thị dữ liệu bằng cách tách từng giá trị trong tập dữ liệu thành thân và lá. Đó là một biểu đồ hữu ích để dễ dàng hình dung sự phân bố của một tập dữ liệu. Biểu đồ thân và lá hiếm khi xuất hiện trong các bài báo có lẽ vì nó được xem như một công cụ khám nghiệm để xem xét hình dạng của các phân phối và đưa ra “cảm nhận” cho dữ liệu. Một ưu điểm cụ thể của biểu đồ này là nó cho phép tính toán nhanh chóng và dễ dàng các phân vị của một phân phối, đó là tứ phân vị thấp (hay phân vị thứ 25), trung vị (hay phân vị thứ 50) và tứ phân vị trên (hay phân vị thứ 75).
2. Đồ thị hộp và râu
Một cách hiệu quả để so sánh các phân phối của dữ liệu liên tục (khoảng hoặc tỷ lệ) là với biểu đồ hình hộp và râu. Biểu đồ này thường chỉ thích hợp với dữ liệu liên tục nhưng có thể sử dụng với dữ liệu đếm với điều kiện là có một con số hợp lý của các giá trị dữ liệu riêng biệt. Các đặc điểm phân biệt chính của đồ thị hộp và râu là chiều dài của một hộp từ trên xuống dưới và chiều dài mà các râu kéo dài từ đầu hộp. Tầm quan trọng của biểu đồ hình hộp và râu luôn đi cùng với các phân vị. Phân vị là một thước đo vị trí tương đối trong phân phối điểm số.
Thông thường trong tâm lý học và giáo dục, chúng ta quan tâm đến việc so sánh điểm số của các học sinh khác nhau hoặc của cùng học sinh trong các bài kiểm tra khác nhau. Nếu bạn muốn so sánh thành tích của học sinh trong hai bài kiểm tra khác nhau, bạn cần có một thước đo vị trí tương đối của mỗi bài kiểm tra. Xếp hạng phân vị cung cấp một thước đo thuận tiện về vị trí tương đối trong một nhóm.
Để tính toán phân vị, các giá trị hoặc điểm số dữ liệu được sắp xếp theo thứ tự tăng dần về độ lớn, ví dụ như biểu đồ thân và lá. Phần trăm yêu cầu sau đó được tính lên từ điểm số hoặc giá trị dữ liệu nhỏ nhất. Phân vị thứ 0 là điểm số nhỏ nhất trong phân phối, phân vị thứ 25 là một điểm lớn hơn 25% của tổng phân phối điểm số, nói một cách đơn giản là 25% của các điểm số sẽ bằng hoặc thấp hơn phân vị thứ 25. Phân vị thứ 50 (hay trung vị) là điểm số lớn hơn 50% của điểm số trong phân phối, một nửa số điểm nằm dưới mức trung bình và một nửa ở trên. Phân vị thứ 75 là các điểm số lớn hơn 75% của các điểm số, hay nói cách khác, 75% của các điểm số là bằng hoặc thấp hơn phân vị thứ 75. Phân vị thứ 100 là số điểm lớn nhất trong phân phối.
Tứ phân vị thấp, Q1, chỉ đơn giản là phân vị thứ 25 trong một phân phối. Tương tự, trung vị hoặc Q2 là phân vị thứ 50 và tứ phân vị trên, Q3 là phân vị thứ 75. Khoảng cách giữa Q1 và Q3 được gọi là phạm vi liên tứ phần vị và chứa 50% của tất cả các giá trị trong phân phối.