Gọi X số giờ một sinh viên tự học môn Xác suất thống kê (ngoài thời gian học chính thức trên lớp do giảng viên giảng dạy). Y là điểm số trung bình sinh viên đạt được cho môn học này. Quan sát số giờ tự học và điểm trung bình của một số sinh viên ta được bảng sau:
X (giờ) | 27 | 30 | 30 | 33 | 33 | 39 | 42 | 45 | 45 |
Y | 5 | 6 | 6 | 8 | 7 | 7 | 8 | 9 | 10 |
Dựa vào số liệu này có thể dự đoán được điểm số trung bình của một sinh viên qua số giờ tự học bằng hàm hồi quy tuyến tính thực nghiệm được hay không? Nếu được, hãy viết hàm hồi quy tuyến tính thực nghiệm này.
Trả lời:
Đáp án đúng:
Câu hỏi yêu cầu xác định xem có thể xây dựng hàm hồi quy tuyến tính thực nghiệm để dự đoán điểm số trung bình (Y) dựa trên số giờ tự học (X) từ bảng số liệu cho trước hay không, và nếu có thì viết phương trình hàm hồi quy đó.
Để giải quyết vấn đề này, chúng ta cần thực hiện các bước sau:
1. **Kiểm tra mối quan hệ giữa X và Y**: Dựa vào bảng số liệu, chúng ta có thể quan sát xu hướng chung. Khi số giờ tự học (X) tăng lên, điểm số trung bình (Y) thường có xu hướng tăng theo. Điều này cho thấy có thể tồn tại một mối quan hệ tuyến tính.
2. **Tính toán các tham số của hàm hồi quy tuyến tính**: Hàm hồi quy tuyến tính có dạng tổng quát là $Y = aX + b$. Để ước lượng các tham số $a$ (hệ số góc) và $b$ (hệ số chặn) từ dữ liệu mẫu, chúng ta sử dụng phương pháp bình phương tối thiểu.
* Công thức tính $a$ (hệ số góc): $a = \frac{n(\sum XY) - (\sum X)(\sum Y)}{n(\sum X^2) - (\sum X)^2}$
* Công thức tính $b$ (hệ số chặn): $b = \bar{Y} - a\bar{X} = \frac{\sum Y - a(\sum X)}{n}$
Trong đó:
* $n$ là số cặp quan sát.
* $\sum X$ là tổng các giá trị của X.
* $\sum Y$ là tổng các giá trị của Y.
* $\sum XY$ là tổng tích của các cặp (X, Y).
* $\sum X^2$ là tổng bình phương các giá trị của X.
* $\bar{X}$ là trung bình cộng của X.
* $\bar{Y}$ là trung bình cộng của Y.
3. **Áp dụng vào dữ liệu cho trước**: Ta có các cặp quan sát (X, Y) như sau:
(27, 5), (30, 6), (30, 6), (33, 8), (33, 7), (39, 7), (42, 8), (45, 9), (45, 10).
Số cặp quan sát $n = 9$.
Tính toán các tổng cần thiết:
* $\sum X = 27 + 30 + 30 + 33 + 33 + 39 + 42 + 45 + 45 = 324$
* $\sum Y = 5 + 6 + 6 + 8 + 7 + 7 + 8 + 9 + 10 = 66$
* $\sum X^2 = 27^2 + 30^2 + 30^2 + 33^2 + 33^2 + 39^2 + 42^2 + 45^2 + 45^2 = 729 + 900 + 900 + 1089 + 1089 + 1521 + 1764 + 2025 + 2025 = 12042$
* $\sum XY = (27 \times 5) + (30 \times 6) + (30 \times 6) + (33 \times 8) + (33 imes 7) + (39 imes 7) + (42 imes 8) + (45 imes 9) + (45 imes 10) = 135 + 180 + 180 + 264 + 231 + 273 + 336 + 405 + 450 = 2454$
Tính toán $a$:
$a = \frac{9(2454) - (324)(66)}{9(12042) - (324)^2} = \frac{22086 - 21384}{108378 - 104976} = \frac{702}{3402} \approx 0.206349$
Tính toán $b$:
$\bar{X} = \frac{324}{9} = 36$
$\bar{Y} = \frac{66}{9} \approx 7.333333$
$b = \bar{Y} - a\bar{X} = 7.333333 - 0.206349 \times 36 \approx 7.333333 - 7.428564 \approx -0.095231$
Vậy, hàm hồi quy tuyến tính thực nghiệm là: $Y \approx 0.2063X - 0.0952$
4. **Kết luận**: Dựa vào số liệu, có thể dự đoán được điểm số trung bình của một sinh viên qua số giờ tự học bằng hàm hồi quy tuyến tính thực nghiệm. Hàm hồi quy tuyến tính thực nghiệm được viết như trên.
Do đó, câu hỏi có thể trả lời được và có một phương trình hồi quy cụ thể.
Đề thi cuối kỳ môn Xác suất thống kê ứng dụng (MATH132901) dành cho sinh viên Trường Đại học Sư phạm Kỹ thuật TP.HCM, bao gồm các bài toán về tính xác suất, phân phối xác suất, ước lượng thống kê và kiểm định giả thuyết.
8 câu hỏi 90 phút