JavaScript is required

Khảo sát đồng thời thu nhập trong 1 tháng X (đơn vị: triệu đồng) và chi tiêu trong 1 tháng Y (đơn vị: triệu đồng) của một số hộ gia đình ở vùng A, ta thu được bảng số liệu ghép cặp, từ đó suy ra số tiền dư được trong 1 tháng D như sau:

X 40 42 35 45 31 58 22 47 59 50
Y 37 38 30 40 25 54 19 41 47 45
D = X - Y 3 4 5 5 6 4 3 6 12 5

Giả sử rằng X, Y có phân phối chuẩn.

a. Tìm khoảng tin cậy 95% cho số tiền dư trung bình trong 1 tháng của mỗi hộ gia đình ở vùng A.

b. Với mức ý nghĩa 2%, hãy kiểm định ý kiến cho rằng trung bình trong 1 tháng mỗi hộ gia đình ở vùng A tiết kiệm được 4 triệu đồng.

c. Với dữ liệu ghép cặp của hai biến ngẫu nhiên (X, Y) đã cho, có thể dự đoán được mức chi tiêu trung bình của một hộ gia đình ở vùng A khi biết thu nhập của hộ đó bằng hàm hồi quy tuyến tính thực nghiệm được hay không? Nếu có hãy dự đoán mức chi tiêu trung bình của một hộ có thu nhập là 65 triệu đồng 1 tháng.

Chú ý: Một số giá trị zα/2, t(α,9)

α 0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 0.045 0.05
zα 2.576 2.326 2.170 2.054 1.960 1.881 1.812 1.751 1.695 1.645
t(α,9) 3.250 2.821 2.574 2.398 2.262  2.150 2.055 1.973 1.899 1.833

Trả lời:

Đáp án đúng:


Để giải quyết bài toán này, chúng ta cần thực hiện ba phần: a. Tìm khoảng tin cậy cho số tiền dư trung bình, b. Kiểm định giả thuyết về số tiền dư trung bình, và c. Xây dựng và sử dụng mô hình hồi quy tuyến tính. **Phân tích dữ liệu:** Đầu tiên, ta cần tính toán các đại lượng thống kê cơ bản từ dữ liệu đã cho về thu nhập (X), chi tiêu (Y) và số tiền dư (D = X - Y) của 10 hộ gia đình. Các giá trị của D là: 3, 4, 5, 5, 6, 4, 3, 6, 12, 5. Số lượng mẫu (n) = 10. Trung bình mẫu của D ( $\bar{D}$) = (3 + 4 + 5 + 5 + 6 + 4 + 3 + 6 + 12 + 5) / 10 = 53 / 10 = 5.3 Phương sai mẫu của D (s²_D) = [ Σ(Dᵢ - $\bar{D}$)² ] / (n-1) Ta cần tính tổng bình phương độ lệch: (3-5.3)² = (-2.3)² = 5.29 (4-5.3)² = (-1.3)² = 1.69 (5-5.3)² = (-0.3)² = 0.09 (5-5.3)² = (-0.3)² = 0.09 (6-5.3)² = (0.7)² = 0.49 (4-5.3)² = (-1.3)² = 1.69 (3-5.3)² = (-2.3)² = 5.29 (6-5.3)² = (0.7)² = 0.49 (12-5.3)² = (6.7)² = 44.89 (5-5.3)² = (-0.3)² = 0.09 Tổng Σ(Dᵢ - $\bar{D}$)² = 5.29 + 1.69 + 0.09 + 0.09 + 0.49 + 1.69 + 5.29 + 0.49 + 44.89 + 0.09 = 60.1 Phương sai mẫu s²_D = 60.1 / (10 - 1) = 60.1 / 9 ≈ 6.6778 Độ lệch chuẩn mẫu của D (s_D) = √6.6778 ≈ 2.5841 **a. Tìm khoảng tin cậy 95% cho số tiền dư trung bình:** Do kích thước mẫu nhỏ (n=10) và giả định X, Y có phân phối chuẩn nên D cũng có phân phối chuẩn. Chúng ta sử dụng phân phối t để tìm khoảng tin cậy. Cấp độ tin cậy là 95%, do đó α = 1 - 0.95 = 0.05. Ta cần tìm giá trị t_(α/2, n-1) = t_(0.025, 9). Từ bảng tra cứu, t_(0.025, 9) = 2.262. Sai số biên (Margin of Error) = t_(α/2, n-1) * (s_D / √n) = 2.262 * (2.5841 / √10) ≈ 2.262 * (2.5841 / 3.1623) ≈ 2.262 * 0.8171 ≈ 1.8478 Khoảng tin cậy 95% cho μ_D là: $\bar{D}$ ± Sai số biên = 5.3 ± 1.8478 = (3.4522, 7.1478) **b. Kiểm định ý kiến cho rằng trung bình tiết kiệm được 4 triệu đồng với mức ý nghĩa 2%:** * **Giả thuyết:** H₀: μ_D = 4 (Trung bình số tiền dư là 4 triệu đồng) H₁: μ_D ≠ 4 (Trung bình số tiền dư khác 4 triệu đồng) - Kiểm định hai phía. * **Mức ý nghĩa:** α = 0.02. * **Kiểm định thống kê:** Vì n < 30 và phương sai tổng thể không biết, ta sử dụng thống kê t: t = ($\bar{D}$ - μ₀) / (s_D / √n) trong đó μ₀ là giá trị trung bình dưới giả thuyết H₀. * **Tính giá trị thống kê t:** t = (5.3 - 4) / (2.5841 / √10) = 1.3 / 0.8171 ≈ 1.5910 * **Tìm giá trị tới hạn:** Với mức ý nghĩa α = 0.02 và bậc tự do df = n - 1 = 9, ta cần tìm t_(α/2, 9) = t_(0.01, 9). Từ bảng tra cứu, t_(0.01, 9) = 2.821. Vùng bác bỏ H₀ là t < -2.821 hoặc t > 2.821. * **Quyết định:** Giá trị thống kê t = 1.5910 không nằm trong vùng bác bỏ H₀ (vì -2.821 < 1.5910 < 2.821). Do đó, chúng ta không có đủ bằng chứng để bác bỏ giả thuyết H₀ ở mức ý nghĩa 2%. * **Kết luận:** Với mức ý nghĩa 2%, không có đủ bằng chứng để bác bỏ ý kiến cho rằng trung bình mỗi hộ gia đình ở vùng A tiết kiệm được 4 triệu đồng trong 1 tháng. **c. Dự đoán mức chi tiêu trung bình khi biết thu nhập bằng hàm hồi quy tuyến tính:** Ta cần xây dựng mô hình hồi quy tuyến tính để dự đoán Y (chi tiêu) dựa trên X (thu nhập). Mô hình có dạng: $\hat{Y}$ = b₀ + b₁X. * **Ước lượng hệ số hồi quy:** b₁ = Sxy / Sxx b₀ = $\bar{Y}$ - b₁$\bar{X}$ Ta cần tính các giá trị sau: $\bar{X}$ = (40 + 42 + 35 + 45 + 31 + 58 + 22 + 47 + 59 + 50) / 10 = 429 / 10 = 42.9 $\bar{Y}$ = (37 + 38 + 30 + 40 + 25 + 54 + 19 + 41 + 47 + 45) / 10 = 376 / 10 = 37.6 Ta cần tính Sxx và Sxy. Sxx = ΣX² - n$\bar{X}$² Sxy = ΣXY - n$\bar{X}$$\bar{Y}$ Ta tính ΣX², ΣY², ΣXY: ΣX² = 40²+42²+35²+45²+31²+58²+22²+47²+59²+50² = 1600+1764+1225+2025+961+3364+484+2209+3481+2500 = 19613 ΣY² = 37²+38²+30²+40²+25²+54²+19²+41²+47²+45² = 1369+1444+900+1600+625+2916+361+1681+2209+2025 = 15130 ΣXY = 40*37 + 42*38 + 35*30 + 45*40 + 31*25 + 58*54 + 22*19 + 47*41 + 59*47 + 50*45 = 1480 + 1596 + 1050 + 1800 + 775 + 3132 + 418 + 1927 + 2773 + 2250 = 17201 Sxx = 19613 - 10 * (42.9)² = 19613 - 10 * 1840.41 = 19613 - 18404.1 = 1208.9 Sxy = 17201 - 10 * (42.9) * (37.6) = 17201 - 10 * 1613.04 = 17201 - 16130.4 = 1070.6 * **Ước lượng b₁:** b₁ = Sxy / Sxx = 1070.6 / 1208.9 ≈ 0.8856 * **Ước lượng b₀:** b₀ = $\bar{Y}$ - b₁$\bar{X}$ = 37.6 - 0.8856 * 42.9 = 37.6 - 38.00264 ≈ -0.4026 * **Hàm hồi quy tuyến tính thực nghiệm:** $\hat{Y}$ = -0.4026 + 0.8856X Có, với dữ liệu ghép cặp của hai biến ngẫu nhiên (X, Y) đã cho, ta có thể dự đoán được mức chi tiêu trung bình của một hộ gia đình ở vùng A khi biết thu nhập của hộ đó bằng hàm hồi quy tuyến tính thực nghiệm được. * **Dự đoán mức chi tiêu trung bình khi thu nhập là 65 triệu đồng:** Thay X = 65 vào hàm hồi quy: $\hat{Y}$ = -0.4026 + 0.8856 * 65 $\hat{Y}$ = -0.4026 + 57.564 $\hat{Y}$ ≈ 57.1614 Vậy, mức chi tiêu trung bình dự đoán cho một hộ gia đình có thu nhập 65 triệu đồng/tháng là khoảng 57.16 triệu đồng.

This document is an end-of-term exam for the Applied Probability and Statistics course (MATH 132901) from the Ho Chi Minh City University of Education. It assesses students' understanding of various topics including basic probability calculations, discrete and continuous probability distributions (Poisson, Normal), descriptive statistics, confidence intervals for proportions and means, hypothesis testing, and linear regression. The exam is 90 minutes long and allows one handwritten A4 sheet.


6 câu hỏi 90 phút

Câu hỏi liên quan