Thay vì dùng biểu đồ tỷ lệ tích lũy để đánh giá phân phối số liệu, có thể dùng biểu đồ hộp với các tứ phân vị Q1, Q2, Q3.
Nếu Q1 + Q3 > 2.Q2 thì phân phối lệch bên nào?
Đáp án đúng: B
Câu hỏi này liên quan đến việc hiểu ý nghĩa của biểu đồ hộp (boxplot) và các tứ phân vị (Q1, Q2, Q3) trong việc đánh giá tính đối xứng của phân phối dữ liệu. Dưới đây là phân tích chi tiết:
Khái niệm cơ bản:
- Tứ phân vị (Quartiles): Là các giá trị chia tập dữ liệu đã sắp xếp thành bốn phần bằng nhau. Q1 là tứ phân vị thứ nhất (25% dữ liệu), Q2 là tứ phân vị thứ hai (trung vị, 50% dữ liệu), và Q3 là tứ phân vị thứ ba (75% dữ liệu).
- Biểu đồ hộp (Boxplot): Thể hiện sự phân bố của dữ liệu dựa trên năm số tóm tắt: giá trị nhỏ nhất, Q1, Q2, Q3 và giá trị lớn nhất. Độ dài của hộp (IQR = Q3 - Q1) cho biết sự biến thiên của dữ liệu ở giữa.
- Tính đối xứng của phân phối: Nếu phân phối đối xứng, trung vị (Q2) sẽ nằm ở giữa hộp, và khoảng cách từ Q2 đến Q1 và Q3 sẽ tương đương. Nếu phân phối lệch, trung vị sẽ lệch về một phía của hộp.
Phân tích điều kiện Q1 + Q3 > 2.Q2:
Bất đẳng thức Q1 + Q3 > 2.Q2 có thể được viết lại thành Q3 - Q2 > Q2 - Q1. Điều này có nghĩa là khoảng cách từ Q2 đến Q3 lớn hơn khoảng cách từ Q1 đến Q2.
Ý nghĩa thống kê:
Khi Q3 - Q2 > Q2 - Q1, điều này chỉ ra rằng phần đuôi bên phải của phân phối (từ Q2 đến Q3) dài hơn phần đuôi bên trái (từ Q1 đến Q2). Nói cách khác, dữ liệu tập trung nhiều hơn ở phía dưới và có xu hướng kéo dài về phía các giá trị lớn hơn. Do đó, phân phối bị lệch phải (hoặc lệch dương).
Kết luận:
Nếu Q1 + Q3 > 2.Q2, phân phối sẽ lệch về bên phải.