Tại một công ty A, 45% nhân viên thường sử dụng ứng dụng Grab, 35% nhân viên thường sử dụng ứng dụng Be, và 20% nhân viên thường sử dụng ứng dụng Gojek. Các ứng dụng này thường được dùng để gọi đặt xe, đặt đồ ăn và giao hàng. Trong số những nhân viên sử dụng ứng dụng Grab có 70% người thường dùng ứng dụng để gọi xe; tương tự với Be là 50% và Gojek là 40%. Biết một nhân viên gọi đặt xe, tính xác suất người này sử dung ứng dụng Grab.
Trả lời:
Đáp án đúng:
Câu hỏi này thuộc về lĩnh vực xác suất thống kê, cụ thể là áp dụng định lý Bayes để tính xác suất có điều kiện. Để giải quyết bài toán này, chúng ta cần xác định các biến cố và xác suất tương ứng:
Gọi G là biến cố nhân viên sử dụng ứng dụng Grab.
Gọi B là biến cố nhân viên sử dụng ứng dụng Be.
Gọi J là biến cố nhân viên sử dụng ứng dụng Gojek.
Gọi X là biến cố nhân viên thường dùng ứng dụng để gọi đặt xe.
Theo đề bài, ta có các xác suất ban đầu:
P(G) = 0.45
P(B) = 0.35
P(J) = 0.20
Ta cũng có xác suất có điều kiện của việc gọi xe khi biết đã sử dụng từng ứng dụng:
P(X|G) = 0.70
P(X|B) = 0.50
P(X|J) = 0.40
Đề bài yêu cầu tính xác suất nhân viên sử dụng ứng dụng Grab biết rằng họ đã gọi đặt xe, tức là tính P(G|X).
Theo định lý Bayes:
P(G|X) = [P(X|G) * P(G)] / P(X)
Để tính P(X), chúng ta sử dụng công thức xác suất toàn phần:
P(X) = P(X|G) * P(G) + P(X|B) * P(B) + P(X|J) * P(J)
P(X) = (0.70 * 0.45) + (0.50 * 0.35) + (0.40 * 0.20)
P(X) = 0.315 + 0.175 + 0.08
P(X) = 0.57
Bây giờ, thay các giá trị vào công thức định lý Bayes:
P(G|X) = (0.70 * 0.45) / 0.57
P(G|X) = 0.315 / 0.57
P(G|X) ≈ 0.5526
Vậy, xác suất người này sử dụng ứng dụng Grab khi biết họ gọi đặt xe là khoảng 0.5526 hoặc 55.26%.
Đề thi cuối kỳ môn Xác suất thống kê ứng dụng (MATH132901) dành cho sinh viên Trường Đại học Sư phạm Kỹ thuật TP.HCM, bao gồm các bài toán về tính xác suất, phân phối xác suất, ước lượng thống kê và kiểm định giả thuyết.
8 câu hỏi 90 phút
Câu hỏi liên quan
Lời giải:
Câu hỏi này yêu cầu tính xác suất để có đúng 30 người trong số 100 người tham gia chạy có thời gian hoàn thành bán marathon nhỏ hơn 2,5 giờ. Chúng ta biết rằng thời gian chạy tuân theo phân phối chuẩn với trung bình (μ) là 2,75 giờ và độ lệch chuẩn (σ) là 0,25 giờ. Đây là bài toán kết hợp giữa phân phối chuẩn và phân phối nhị thức.
Bước 1: Tính xác suất một người chạy có thời gian hoàn thành nhỏ hơn 2,5 giờ.
Đầu tiên, ta cần chuẩn hóa giá trị 2,5 giờ bằng cách sử dụng công thức Z-score: Z = (X - μ) / σ.
Trong trường hợp này, X = 2,5 giờ, μ = 2,75 giờ, và σ = 0,25 giờ.
Z = (2,5 - 2,75) / 0,25 = -0,25 / 0,25 = -1.
Tiếp theo, ta tìm xác suất P(Z < -1). Tra bảng phân phối chuẩn hoặc sử dụng công cụ tính toán, ta được P(Z < -1) ≈ 0,1587.
Vậy, xác suất để một người chạy có thời gian hoàn thành bán marathon nhỏ hơn 2,5 giờ là p ≈ 0,1587.
Bước 2: Áp dụng phân phối nhị thức.
Bây giờ, chúng ta có một chuỗi các thử nghiệm độc lập (100 người tham gia), mỗi thử nghiệm có hai kết quả: thành công (thời gian chạy < 2,5 giờ) với xác suất p ≈ 0,1587, hoặc thất bại (thời gian chạy ≥ 2,5 giờ) với xác suất 1-p.
Chúng ta muốn tính xác suất có đúng k = 30 người thành công trong n = 100 thử nghiệm. Công thức của phân phối nhị thức là:
P(X = k) = C(n, k) * p^k * (1-p)^(n-k)
Trong đó:
n = 100 (tổng số người tham gia)
k = 30 (số người có thời gian chạy dưới 2,5 giờ)
p ≈ 0,1587 (xác suất một người chạy dưới 2,5 giờ)
1-p ≈ 1 - 0,1587 = 0,8413
C(n, k) là tổ hợp chập k của n, tức là C(100, 30).
Bước 3: Tính toán xác suất.
P(X = 30) = C(100, 30) * (0,1587)^30 * (0,8413)^(100-30)
P(X = 30) = C(100, 30) * (0,1587)^30 * (0,8413)^70.
Việc tính toán trực tiếp giá trị này (đặc biệt là C(100, 30) và các lũy thừa) đòi hỏi sử dụng máy tính khoa học hoặc phần mềm thống kê. Sau khi tính toán, ta sẽ thu được một giá trị rất nhỏ.
Kết quả cuối cùng: Giá trị xấp xỉ của P(X = 30) là khoảng 0,000058.
Bước 1: Tính xác suất một người chạy có thời gian hoàn thành nhỏ hơn 2,5 giờ.
Đầu tiên, ta cần chuẩn hóa giá trị 2,5 giờ bằng cách sử dụng công thức Z-score: Z = (X - μ) / σ.
Trong trường hợp này, X = 2,5 giờ, μ = 2,75 giờ, và σ = 0,25 giờ.
Z = (2,5 - 2,75) / 0,25 = -0,25 / 0,25 = -1.
Tiếp theo, ta tìm xác suất P(Z < -1). Tra bảng phân phối chuẩn hoặc sử dụng công cụ tính toán, ta được P(Z < -1) ≈ 0,1587.
Vậy, xác suất để một người chạy có thời gian hoàn thành bán marathon nhỏ hơn 2,5 giờ là p ≈ 0,1587.
Bước 2: Áp dụng phân phối nhị thức.
Bây giờ, chúng ta có một chuỗi các thử nghiệm độc lập (100 người tham gia), mỗi thử nghiệm có hai kết quả: thành công (thời gian chạy < 2,5 giờ) với xác suất p ≈ 0,1587, hoặc thất bại (thời gian chạy ≥ 2,5 giờ) với xác suất 1-p.
Chúng ta muốn tính xác suất có đúng k = 30 người thành công trong n = 100 thử nghiệm. Công thức của phân phối nhị thức là:
P(X = k) = C(n, k) * p^k * (1-p)^(n-k)
Trong đó:
n = 100 (tổng số người tham gia)
k = 30 (số người có thời gian chạy dưới 2,5 giờ)
p ≈ 0,1587 (xác suất một người chạy dưới 2,5 giờ)
1-p ≈ 1 - 0,1587 = 0,8413
C(n, k) là tổ hợp chập k của n, tức là C(100, 30).
Bước 3: Tính toán xác suất.
P(X = 30) = C(100, 30) * (0,1587)^30 * (0,8413)^(100-30)
P(X = 30) = C(100, 30) * (0,1587)^30 * (0,8413)^70.
Việc tính toán trực tiếp giá trị này (đặc biệt là C(100, 30) và các lũy thừa) đòi hỏi sử dụng máy tính khoa học hoặc phần mềm thống kê. Sau khi tính toán, ta sẽ thu được một giá trị rất nhỏ.
Kết quả cuối cùng: Giá trị xấp xỉ của P(X = 30) là khoảng 0,000058.
Lời giải:
Câu hỏi này thuộc lĩnh vực xác suất thống kê, tập trung vào việc sử dụng hàm mật độ xác suất để tính toán các tham số và xác suất liên quan đến biến ngẫu nhiên liên tục.
Phân tích câu hỏi:
* Phần a/ Tìm k: Để tìm hằng số k, chúng ta cần sử dụng tính chất cơ bản của hàm mật độ xác suất: tổng tích phân của hàm mật độ trên toàn bộ miền xác định phải bằng 1. Miền xác định của biến ngẫu nhiên X (tuổi thọ sản phẩm A) là từ 0 đến 7 năm. Do đó, ta cần tính tích phân của f(x) từ 0 đến 7 và cho nó bằng 1 để giải tìm k.
\int_{0}^{7} kx^{2}(7-x) dx = 1
k \int_{0}^{7} (7x^{2}-x^{3}) dx = 1
k \left[ \frac{7x^{3}}{3} - \frac{x^{4}}{4} \right]_{0}^{7} = 1
k \left( \frac{7(7^{3})}{3} - \frac{7^{4}}{4} \right) = 1
k \left( \frac{7^{4}}{3} - \frac{7^{4}}{4} \right) = 1
k \cdot 7^{4} \left( \frac{1}{3} - \frac{1}{4} \right) = 1
k \cdot 2401 \left( \frac{4-3}{12} \right) = 1
k \cdot \frac{2401}{12} = 1
k = \frac{12}{2401}
* Phần b/ Tính xác suất cho một sản phẩm có tuổi thọ lớn hơn tuổi thọ trung bình:
Đầu tiên, ta cần tính tuổi thọ trung bình (giá trị kỳ vọng) của sản phẩm A, ký hiệu là E(X).
Tuổi thọ trung bình được tính bằng công thức:
E(X) = \int_{-\infty}^{\infty} x f(x) dx
Với hàm mật độ đã cho, ta có:
E(X) = \int_{0}^{7} x \cdot \frac{12}{2401} x^{2}(7-x) dx
E(X) = \frac{12}{2401} \int_{0}^{7} x^{3}(7-x) dx
E(X) = \frac{12}{2401} \int_{0}^{7} (7x^{3}-x^{4}) dx
E(X) = \frac{12}{2401} \left[ \frac{7x^{4}}{4} - \frac{x^{5}}{5} \right]_{0}^{7}
E(X) = \frac{12}{2401} \left( \frac{7(7^{4})}{4} - \frac{7^{5}}{5} \right)
E(X) = \frac{12}{2401} \left( \frac{7^{5}}{4} - \frac{7^{5}}{5} \right)
E(X) = \frac{12}{7^{4}} \left( \frac{7^{5}}{4} - \frac{7^{5}}{5} \right)
E(X) = 12 \cdot 7 \left( \frac{1}{4} - \frac{1}{5} \right)
E(X) = 84 \left( \frac{5-4}{20} \right)
E(X) = 84 \cdot \frac{1}{20}
E(X) = \frac{84}{20} = \frac{21}{5} = 4.2
Sau khi có tuổi thọ trung bình là 4.2 năm, ta cần tính xác suất để một sản phẩm có tuổi thọ lớn hơn 4.2 năm. Điều này được tính bằng tích phân hàm mật độ từ 4.2 đến 7:
P(X > 4.2) = \int_{4.2}^{7} \frac{12}{2401} x^{2}(7-x) dx
P(X > 4.2) = \frac{12}{2401} \int_{4.2}^{7} (7x^{2}-x^{3}) dx
P(X > 4.2) = \frac{12}{2401} \left[ \frac{7x^{3}}{3} - \frac{x^{4}}{4} \right]_{4.2}^{7}
P(X > 4.2) = \frac{12}{2401} \left[ \left( \frac{7(7^{3})}{3} - \frac{7^{4}}{4} \right) - \left( \frac{7(4.2^{3})}{3} - \frac{4.2^{4}}{4} \right) \right]
P(X > 4.2) = \frac{12}{2401} \left[ \left( \frac{2401}{3} - \frac{2401}{4} \right) - \left( \frac{7(74.088)}{3} - \frac{311.1696}{4} \right) \right]
P(X > 4.2) = \frac{12}{2401} \left[ \frac{2401}{12} - \left( \frac{518.616}{3} - 77.7924 \right) \right]
P(X > 4.2) = \frac{12}{2401} \left[ 200.08333 - (172.872 - 77.7924) \right]
P(X > 4.2) = \frac{12}{2401} \left[ 200.08333 - 95.0796 \right]
P(X > 4.2) = \frac{12}{2401} \left[ 105.00373 \right]
P(X > 4.2) \approx 0.52502 \\
Do câu hỏi không cung cấp các lựa chọn đáp án để đánh giá `answer_iscorrect`, nên ta sẽ bỏ qua phần này và tập trung vào việc giải thích chi tiết.
Phân tích câu hỏi:
* Phần a/ Tìm k: Để tìm hằng số k, chúng ta cần sử dụng tính chất cơ bản của hàm mật độ xác suất: tổng tích phân của hàm mật độ trên toàn bộ miền xác định phải bằng 1. Miền xác định của biến ngẫu nhiên X (tuổi thọ sản phẩm A) là từ 0 đến 7 năm. Do đó, ta cần tính tích phân của f(x) từ 0 đến 7 và cho nó bằng 1 để giải tìm k.
\int_{0}^{7} kx^{2}(7-x) dx = 1
k \int_{0}^{7} (7x^{2}-x^{3}) dx = 1
k \left[ \frac{7x^{3}}{3} - \frac{x^{4}}{4} \right]_{0}^{7} = 1
k \left( \frac{7(7^{3})}{3} - \frac{7^{4}}{4} \right) = 1
k \left( \frac{7^{4}}{3} - \frac{7^{4}}{4} \right) = 1
k \cdot 7^{4} \left( \frac{1}{3} - \frac{1}{4} \right) = 1
k \cdot 2401 \left( \frac{4-3}{12} \right) = 1
k \cdot \frac{2401}{12} = 1
k = \frac{12}{2401}
* Phần b/ Tính xác suất cho một sản phẩm có tuổi thọ lớn hơn tuổi thọ trung bình:
Đầu tiên, ta cần tính tuổi thọ trung bình (giá trị kỳ vọng) của sản phẩm A, ký hiệu là E(X).
Tuổi thọ trung bình được tính bằng công thức:
E(X) = \int_{-\infty}^{\infty} x f(x) dx
Với hàm mật độ đã cho, ta có:
E(X) = \int_{0}^{7} x \cdot \frac{12}{2401} x^{2}(7-x) dx
E(X) = \frac{12}{2401} \int_{0}^{7} x^{3}(7-x) dx
E(X) = \frac{12}{2401} \int_{0}^{7} (7x^{3}-x^{4}) dx
E(X) = \frac{12}{2401} \left[ \frac{7x^{4}}{4} - \frac{x^{5}}{5} \right]_{0}^{7}
E(X) = \frac{12}{2401} \left( \frac{7(7^{4})}{4} - \frac{7^{5}}{5} \right)
E(X) = \frac{12}{2401} \left( \frac{7^{5}}{4} - \frac{7^{5}}{5} \right)
E(X) = \frac{12}{7^{4}} \left( \frac{7^{5}}{4} - \frac{7^{5}}{5} \right)
E(X) = 12 \cdot 7 \left( \frac{1}{4} - \frac{1}{5} \right)
E(X) = 84 \left( \frac{5-4}{20} \right)
E(X) = 84 \cdot \frac{1}{20}
E(X) = \frac{84}{20} = \frac{21}{5} = 4.2
Sau khi có tuổi thọ trung bình là 4.2 năm, ta cần tính xác suất để một sản phẩm có tuổi thọ lớn hơn 4.2 năm. Điều này được tính bằng tích phân hàm mật độ từ 4.2 đến 7:
P(X > 4.2) = \int_{4.2}^{7} \frac{12}{2401} x^{2}(7-x) dx
P(X > 4.2) = \frac{12}{2401} \int_{4.2}^{7} (7x^{2}-x^{3}) dx
P(X > 4.2) = \frac{12}{2401} \left[ \frac{7x^{3}}{3} - \frac{x^{4}}{4} \right]_{4.2}^{7}
P(X > 4.2) = \frac{12}{2401} \left[ \left( \frac{7(7^{3})}{3} - \frac{7^{4}}{4} \right) - \left( \frac{7(4.2^{3})}{3} - \frac{4.2^{4}}{4} \right) \right]
P(X > 4.2) = \frac{12}{2401} \left[ \left( \frac{2401}{3} - \frac{2401}{4} \right) - \left( \frac{7(74.088)}{3} - \frac{311.1696}{4} \right) \right]
P(X > 4.2) = \frac{12}{2401} \left[ \frac{2401}{12} - \left( \frac{518.616}{3} - 77.7924 \right) \right]
P(X > 4.2) = \frac{12}{2401} \left[ 200.08333 - (172.872 - 77.7924) \right]
P(X > 4.2) = \frac{12}{2401} \left[ 200.08333 - 95.0796 \right]
P(X > 4.2) = \frac{12}{2401} \left[ 105.00373 \right]
P(X > 4.2) \approx 0.52502 \\
Do câu hỏi không cung cấp các lựa chọn đáp án để đánh giá `answer_iscorrect`, nên ta sẽ bỏ qua phần này và tập trung vào việc giải thích chi tiết.
Lời giải:
Câu hỏi yêu cầu thực hiện hai phần: (a) ước lượng khoảng tin cậy cho số đơn hàng trung bình và (b) kiểm định giả thuyết về số đơn hàng trung bình. Dữ liệu được cung cấp dưới dạng bảng tần số ghép nhóm, cho biết số đơn hàng mỗi ngày của mỗi shipper. Chúng ta cần giả định rằng số đơn hàng tuân theo phân phối chuẩn.
Phần a: Ước lượng khoảng tin cậy tối đa
Đầu tiên, chúng ta cần tính toán các tham số thống kê từ dữ liệu mẫu.
- Xác định điểm giữa của mỗi khoảng: 9, 11, 13, 15, 17, 19.
- Tính tần số:
- 8-10: 10
- 10-12: 20
- 12-14: 8
- 14-16: 10
- 16-18: 8
- 18-20: 2
- Tổng số quan sát (n) = 10 + 20 + 8 + 10 + 8 + 2 = 58.
- Tính trung bình mẫu (x̄):
x̄ = (9*10 + 11*20 + 13*8 + 15*10 + 17*8 + 19*2) / 58
x̄ = (90 + 220 + 104 + 150 + 136 + 38) / 58
x̄ = 738 / 58 ≈ 12.724
- Tính phương sai mẫu hiệu chỉnh (s²):
s² = [Σ(f_i * x_i²) - (Σ(f_i * x_i))²/n] / (n-1)
Σ(f_i * x_i²) = 9²*10 + 11²*20 + 13²*8 + 15²*10 + 17²*8 + 19²*2
= 81*10 + 121*20 + 169*8 + 225*10 + 289*8 + 361*2
= 810 + 2420 + 1352 + 2250 + 2312 + 722
= 9866
s² = [9866 - (738)²/58] / (58-1)
s² = [9866 - 544644/58] / 57
s² = [9866 - 9390.41] / 57
s² = 475.59 / 57 ≈ 8.344
- Độ lệch chuẩn mẫu hiệu chỉnh (s) = √8.344 ≈ 2.889
Vì cỡ mẫu lớn (n=58 > 30) và chúng ta không biết độ lệch chuẩn tổng thể (σ), chúng ta sẽ sử dụng phân phối Z hoặc t. Với n lớn, phân phối Z là phù hợp hoặc có thể sử dụng phân phối t với độ tự do df = n-1 = 57.
Với độ tin cậy 99% (α = 0.01), chúng ta cần tìm giá trị tới hạn. Câu hỏi yêu cầu ước lượng tối đa, nghĩa là chúng ta đang xây dựng khoảng tin cậy một phía (upper confidence bound).
- Sử dụng phân phối Z: z_(α) = z_0.01. Tuy nhiên, khi ước lượng tối đa, chúng ta dùng z_(1-α) hoặc z_(α/2) tùy thuộc vào cách thiết lập khoảng. Đối với khoảng tin cậy một phía trên, chúng ta dùng giá trị z tại mức ý nghĩa α.
z_(0.01) ≈ 2.326. (Do chúng ta ước lượng khoảng trên, nên ta xem xét phần đuôi bên phải của phân phối).
- Sai số chuẩn của trung bình mẫu (SE) = s / √n = 2.889 / √58 ≈ 2.889 / 7.616 ≈ 0.379
- Khoảng tin cậy tối đa cho trung bình tổng thể (μ) là: x̄ + z_(α) * SE
UB = 12.724 + 2.326 * 0.379
UB ≈ 12.724 + 0.881 ≈ 13.605
Nếu sử dụng phân phối t với df=57 và α=0.01 (khoảng tin cậy một phía trên), ta tìm t_(0.01, 57). Giá trị này xấp xỉ 2.390 (tra bảng t hoặc dùng phần mềm).
UB = x̄ + t_(α, df) * SE
UB = 12.724 + 2.390 * 0.379
UB ≈ 12.724 + 0.906 ≈ 13.630
Do câu hỏi không chỉ rõ sử dụng Z hay t, và với cỡ mẫu lớn, hai cách cho kết quả tương tự. Ta chọn giá trị dựa trên t vì nó chính xác hơn khi phương sai tổng thể không biết.
Phần b: Kiểm định giả thuyết
- Nghi ngờ ban đầu: Số đơn hàng trung bình sẽ giảm đi so với 20 đơn trước giãn cách.
- Giả thuyết không (H0): Số đơn hàng trung bình sau giãn cách lớn hơn hoặc bằng 20 (μ ≥ 20).
- Giả thuyết đối (H1): Số đơn hàng trung bình sau giãn cách nhỏ hơn 20 (μ < 20).
Đây là kiểm định giả thuyết một phía (bên trái).
- Mức ý nghĩa α = 5% = 0.05.
- Chúng ta có thể sử dụng giá trị trung bình mẫu tính được ở phần a (x̄ ≈ 12.724) và độ lệch chuẩn mẫu (s ≈ 2.889).
- Vì H0 là μ ≥ 20, chúng ta cần tính điểm thống kê kiểm định t (hoặc Z nếu coi là xấp xỉ).
t = (x̄ - μ₀) / (s / √n)
Ở đây, μ₀ là giá trị từ giả thuyết không, nhưng để tính điểm thống kê, ta thường dùng giá trị biên của H0, tức là μ₀ = 20.
t = (12.724 - 20) / (2.889 / √58)
t = -7.276 / 0.379
t ≈ -19.20
- Giá trị tới hạn cho kiểm định một phía bên trái với α=0.05 và df=57: t_(0.05, 57). Tra bảng t, giá trị này là khoảng -1.671.
- Quy tắc quyết định: Nếu t tính toán < t tới hạn, bác bỏ H0.
-19.20 < -1.671. Do đó, chúng ta bác bỏ giả thuyết không.
- Kết luận: Với mức ý nghĩa 5%, có đủ bằng chứng thống kê để kết luận rằng số đơn hàng trung bình mỗi ngày của mỗi shipper đã giảm xuống dưới 20.
Phần a: Ước lượng khoảng tin cậy tối đa
Đầu tiên, chúng ta cần tính toán các tham số thống kê từ dữ liệu mẫu.
- Xác định điểm giữa của mỗi khoảng: 9, 11, 13, 15, 17, 19.
- Tính tần số:
- 8-10: 10
- 10-12: 20
- 12-14: 8
- 14-16: 10
- 16-18: 8
- 18-20: 2
- Tổng số quan sát (n) = 10 + 20 + 8 + 10 + 8 + 2 = 58.
- Tính trung bình mẫu (x̄):
x̄ = (9*10 + 11*20 + 13*8 + 15*10 + 17*8 + 19*2) / 58
x̄ = (90 + 220 + 104 + 150 + 136 + 38) / 58
x̄ = 738 / 58 ≈ 12.724
- Tính phương sai mẫu hiệu chỉnh (s²):
s² = [Σ(f_i * x_i²) - (Σ(f_i * x_i))²/n] / (n-1)
Σ(f_i * x_i²) = 9²*10 + 11²*20 + 13²*8 + 15²*10 + 17²*8 + 19²*2
= 81*10 + 121*20 + 169*8 + 225*10 + 289*8 + 361*2
= 810 + 2420 + 1352 + 2250 + 2312 + 722
= 9866
s² = [9866 - (738)²/58] / (58-1)
s² = [9866 - 544644/58] / 57
s² = [9866 - 9390.41] / 57
s² = 475.59 / 57 ≈ 8.344
- Độ lệch chuẩn mẫu hiệu chỉnh (s) = √8.344 ≈ 2.889
Vì cỡ mẫu lớn (n=58 > 30) và chúng ta không biết độ lệch chuẩn tổng thể (σ), chúng ta sẽ sử dụng phân phối Z hoặc t. Với n lớn, phân phối Z là phù hợp hoặc có thể sử dụng phân phối t với độ tự do df = n-1 = 57.
Với độ tin cậy 99% (α = 0.01), chúng ta cần tìm giá trị tới hạn. Câu hỏi yêu cầu ước lượng tối đa, nghĩa là chúng ta đang xây dựng khoảng tin cậy một phía (upper confidence bound).
- Sử dụng phân phối Z: z_(α) = z_0.01. Tuy nhiên, khi ước lượng tối đa, chúng ta dùng z_(1-α) hoặc z_(α/2) tùy thuộc vào cách thiết lập khoảng. Đối với khoảng tin cậy một phía trên, chúng ta dùng giá trị z tại mức ý nghĩa α.
z_(0.01) ≈ 2.326. (Do chúng ta ước lượng khoảng trên, nên ta xem xét phần đuôi bên phải của phân phối).
- Sai số chuẩn của trung bình mẫu (SE) = s / √n = 2.889 / √58 ≈ 2.889 / 7.616 ≈ 0.379
- Khoảng tin cậy tối đa cho trung bình tổng thể (μ) là: x̄ + z_(α) * SE
UB = 12.724 + 2.326 * 0.379
UB ≈ 12.724 + 0.881 ≈ 13.605
Nếu sử dụng phân phối t với df=57 và α=0.01 (khoảng tin cậy một phía trên), ta tìm t_(0.01, 57). Giá trị này xấp xỉ 2.390 (tra bảng t hoặc dùng phần mềm).
UB = x̄ + t_(α, df) * SE
UB = 12.724 + 2.390 * 0.379
UB ≈ 12.724 + 0.906 ≈ 13.630
Do câu hỏi không chỉ rõ sử dụng Z hay t, và với cỡ mẫu lớn, hai cách cho kết quả tương tự. Ta chọn giá trị dựa trên t vì nó chính xác hơn khi phương sai tổng thể không biết.
Phần b: Kiểm định giả thuyết
- Nghi ngờ ban đầu: Số đơn hàng trung bình sẽ giảm đi so với 20 đơn trước giãn cách.
- Giả thuyết không (H0): Số đơn hàng trung bình sau giãn cách lớn hơn hoặc bằng 20 (μ ≥ 20).
- Giả thuyết đối (H1): Số đơn hàng trung bình sau giãn cách nhỏ hơn 20 (μ < 20).
Đây là kiểm định giả thuyết một phía (bên trái).
- Mức ý nghĩa α = 5% = 0.05.
- Chúng ta có thể sử dụng giá trị trung bình mẫu tính được ở phần a (x̄ ≈ 12.724) và độ lệch chuẩn mẫu (s ≈ 2.889).
- Vì H0 là μ ≥ 20, chúng ta cần tính điểm thống kê kiểm định t (hoặc Z nếu coi là xấp xỉ).
t = (x̄ - μ₀) / (s / √n)
Ở đây, μ₀ là giá trị từ giả thuyết không, nhưng để tính điểm thống kê, ta thường dùng giá trị biên của H0, tức là μ₀ = 20.
t = (12.724 - 20) / (2.889 / √58)
t = -7.276 / 0.379
t ≈ -19.20
- Giá trị tới hạn cho kiểm định một phía bên trái với α=0.05 và df=57: t_(0.05, 57). Tra bảng t, giá trị này là khoảng -1.671.
- Quy tắc quyết định: Nếu t tính toán < t tới hạn, bác bỏ H0.
-19.20 < -1.671. Do đó, chúng ta bác bỏ giả thuyết không.
- Kết luận: Với mức ý nghĩa 5%, có đủ bằng chứng thống kê để kết luận rằng số đơn hàng trung bình mỗi ngày của mỗi shipper đã giảm xuống dưới 20.
Lời giải:
Câu hỏi yêu cầu thực hiện hai phần:
Phần a: Kiểm định giả thuyết về sự khác biệt giữa hai tỷ lệ. Cụ thể là kiểm định xem tỷ lệ tử vong khi mắc Covid-19 của nhóm không tiêm vắc-xin có cao hơn nhóm có tiêm vắc-xin hay không với mức ý nghĩa 1%.
Để giải quyết phần này, chúng ta cần xác định các tham số:
- Nhóm 1 (không tiêm vắc-xin): n1 = 1000 ca mắc, x1 = 200 ca tử vong. Tỷ lệ mẫu p1_hat = x1/n1 = 200/1000 = 0.2.
- Nhóm 2 (có tiêm vắc-xin): n2 = 1400 ca mắc, x2 = 100 ca tử vong. Tỷ lệ mẫu p2_hat = x2/n2 = 100/1400 ≈ 0.0714.
Giả thuyết kiểm định:
- Giả thuyết không (H0): p1 <= p2 (Tỷ lệ tử vong của nhóm không tiêm vắc-xin không cao hơn nhóm có tiêm vắc-xin).
- Giả thuyết đối (H1): p1 > p2 (Tỷ lệ tử vong của nhóm không tiêm vắc-xin cao hơn nhóm có tiêm vắc-xin).
Mức ý nghĩa: alpha = 1% = 0.01.
Chúng ta sẽ sử dụng kiểm định Z cho hai tỷ lệ. Cần tính tỷ lệ gộp (pooled proportion) để ước lượng phương sai dưới giả thuyết không.
Phần b: Tìm khoảng ước lượng đối xứng cho tỷ lệ tử vong ở nhóm có tiêm vắc-xin với sai số cho trước. Điều này đòi hỏi việc tính toán độ tin cậy dựa trên sai số biên (margin of error) mong muốn.
Các tham số cho phần b:
- Tỷ lệ mẫu của nhóm có tiêm vắc-xin: p2_hat ≈ 0.0714.
- Sai số biên (E): 0.014936174.
Công thức tính sai số biên cho khoảng ước lượng tỷ lệ là: E = Z_(alpha/2) * sqrt(p_hat * (1 - p_hat) / n).
Trong trường hợp này, chúng ta đã có E, p_hat (p2_hat), và n (n2). Chúng ta cần tìm giá trị Z_(alpha/2) tương ứng với độ tin cậy.
Từ E = Z_(alpha/2) * sqrt(p2_hat * (1 - p2_hat) / n2), ta có thể giải phương trình để tìm Z_(alpha/2), sau đó suy ra alpha và độ tin cậy (1 - alpha).
Phần a: Kiểm định giả thuyết về sự khác biệt giữa hai tỷ lệ. Cụ thể là kiểm định xem tỷ lệ tử vong khi mắc Covid-19 của nhóm không tiêm vắc-xin có cao hơn nhóm có tiêm vắc-xin hay không với mức ý nghĩa 1%.
Để giải quyết phần này, chúng ta cần xác định các tham số:
- Nhóm 1 (không tiêm vắc-xin): n1 = 1000 ca mắc, x1 = 200 ca tử vong. Tỷ lệ mẫu p1_hat = x1/n1 = 200/1000 = 0.2.
- Nhóm 2 (có tiêm vắc-xin): n2 = 1400 ca mắc, x2 = 100 ca tử vong. Tỷ lệ mẫu p2_hat = x2/n2 = 100/1400 ≈ 0.0714.
Giả thuyết kiểm định:
- Giả thuyết không (H0): p1 <= p2 (Tỷ lệ tử vong của nhóm không tiêm vắc-xin không cao hơn nhóm có tiêm vắc-xin).
- Giả thuyết đối (H1): p1 > p2 (Tỷ lệ tử vong của nhóm không tiêm vắc-xin cao hơn nhóm có tiêm vắc-xin).
Mức ý nghĩa: alpha = 1% = 0.01.
Chúng ta sẽ sử dụng kiểm định Z cho hai tỷ lệ. Cần tính tỷ lệ gộp (pooled proportion) để ước lượng phương sai dưới giả thuyết không.
Phần b: Tìm khoảng ước lượng đối xứng cho tỷ lệ tử vong ở nhóm có tiêm vắc-xin với sai số cho trước. Điều này đòi hỏi việc tính toán độ tin cậy dựa trên sai số biên (margin of error) mong muốn.
Các tham số cho phần b:
- Tỷ lệ mẫu của nhóm có tiêm vắc-xin: p2_hat ≈ 0.0714.
- Sai số biên (E): 0.014936174.
Công thức tính sai số biên cho khoảng ước lượng tỷ lệ là: E = Z_(alpha/2) * sqrt(p_hat * (1 - p_hat) / n).
Trong trường hợp này, chúng ta đã có E, p_hat (p2_hat), và n (n2). Chúng ta cần tìm giá trị Z_(alpha/2) tương ứng với độ tin cậy.
Từ E = Z_(alpha/2) * sqrt(p2_hat * (1 - p2_hat) / n2), ta có thể giải phương trình để tìm Z_(alpha/2), sau đó suy ra alpha và độ tin cậy (1 - alpha).
Lời giải:
Câu hỏi yêu cầu xác định xem có thể dự đoán điểm số trung bình (Y) của sinh viên dựa trên số giờ tự học (X) bằng hàm hồi quy tuyến tính hay không và nếu có thì viết hàm đó. Để làm được điều này, chúng ta cần kiểm tra mối quan hệ giữa hai biến X và Y. Dữ liệu được cung cấp dưới dạng bảng.
Các bước thực hiện:
1. Phân tích dữ liệu: Quan sát bảng số liệu ta thấy khi số giờ tự học (X) tăng lên, điểm số trung bình (Y) nhìn chung cũng có xu hướng tăng. Ví dụ: X=27, Y=5; X=30, Y=6; X=42, Y=8; X=45, Y=10. Điều này gợi ý có một mối quan hệ tuyến tính dương giữa X và Y.
2. Kiểm định mối quan hệ tuyến tính: Để xác định có thể sử dụng hàm hồi quy tuyến tính hay không, ta cần xem xét hệ số tương quan hoặc thực hiện phân tích hồi quy. Nếu hệ số tương quan đủ mạnh hoặc kết quả phân tích hồi quy cho thấy mối quan hệ có ý nghĩa thống kê, thì có thể xây dựng hàm hồi quy.
3. Tính toán các tham số của hàm hồi quy tuyến tính: Hàm hồi quy tuyến tính có dạng: $\hat{Y} = a + bX$, trong đó:
* $a$ là hệ số chặn (intercept).
* $b$ là hệ số góc (slope), cho biết mức độ thay đổi trung bình của Y khi X thay đổi một đơn vị.
Để tính toán $a$ và $b$, chúng ta cần tính các đại lượng sau từ dữ liệu:
- Số điểm quan sát: $n = 9$
- Tổng các giá trị X: $\sum X = 27 + 30 + 30 + 33 + 33 + 39 + 42 + 45 + 45 = 324$
- Tổng các giá trị Y: $\sum Y = 5 + 6 + 6 + 8 + 7 + 7 + 8 + 9 + 10 = 66$
- Trung bình của X: $\bar{X} = \frac{\sum X}{n} = \frac{324}{9} = 36$
- Trung bình của Y: $\bar{Y} = \frac{\sum Y}{n} = \frac{66}{9} \approx 7.333$
- Tổng các tích X*Y: $\sum XY = (27 \times 5) + (30 \times 6) + (30 \times 6) + (33 \times 8) + (33 imes 7) + (39 imes 7) + (42 imes 8) + (45 imes 9) + (45 imes 10) = 135 + 180 + 180 + 264 + 231 + 273 + 336 + 405 + 450 = 2454$
- Tổng bình phương X: $\sum X^2 = 27^2 + 30^2 + 30^2 + 33^2 + 33^2 + 39^2 + 42^2 + 45^2 + 45^2 = 729 + 900 + 900 + 1089 + 1089 + 1521 + 1764 + 2025 + 2025 = 12042$
Công thức tính hệ số góc $b$: $b = \frac{n(\sum XY) - (\sum X)(\sum Y)}{n(\sum X^2) - (\sum X)^2}$
$b = \frac{9(2454) - (324)(66)}{9(12042) - (324)^2} = \frac{22086 - 21384}{108378 - 104976} = \frac{702}{3402} \approx 0.2063$
Công thức tính hệ số chặn $a$: $a = \bar{Y} - b\bar{X}$
$a = 7.333 - (0.2063)(36) \approx 7.333 - 7.4268 \approx -0.0938$
Vậy, hàm hồi quy tuyến tính thực nghiệm là: $\hat{Y} = -0.0938 + 0.2063X$
Kết luận: Có thể dự đoán được điểm số trung bình của sinh viên qua số giờ tự học bằng hàm hồi quy tuyến tính thực nghiệm. Hàm hồi quy tuyến tính thực nghiệm là $\hat{Y} = -0.0938 + 0.2063X$.
Các bước thực hiện:
1. Phân tích dữ liệu: Quan sát bảng số liệu ta thấy khi số giờ tự học (X) tăng lên, điểm số trung bình (Y) nhìn chung cũng có xu hướng tăng. Ví dụ: X=27, Y=5; X=30, Y=6; X=42, Y=8; X=45, Y=10. Điều này gợi ý có một mối quan hệ tuyến tính dương giữa X và Y.
2. Kiểm định mối quan hệ tuyến tính: Để xác định có thể sử dụng hàm hồi quy tuyến tính hay không, ta cần xem xét hệ số tương quan hoặc thực hiện phân tích hồi quy. Nếu hệ số tương quan đủ mạnh hoặc kết quả phân tích hồi quy cho thấy mối quan hệ có ý nghĩa thống kê, thì có thể xây dựng hàm hồi quy.
3. Tính toán các tham số của hàm hồi quy tuyến tính: Hàm hồi quy tuyến tính có dạng: $\hat{Y} = a + bX$, trong đó:
* $a$ là hệ số chặn (intercept).
* $b$ là hệ số góc (slope), cho biết mức độ thay đổi trung bình của Y khi X thay đổi một đơn vị.
Để tính toán $a$ và $b$, chúng ta cần tính các đại lượng sau từ dữ liệu:
- Số điểm quan sát: $n = 9$
- Tổng các giá trị X: $\sum X = 27 + 30 + 30 + 33 + 33 + 39 + 42 + 45 + 45 = 324$
- Tổng các giá trị Y: $\sum Y = 5 + 6 + 6 + 8 + 7 + 7 + 8 + 9 + 10 = 66$
- Trung bình của X: $\bar{X} = \frac{\sum X}{n} = \frac{324}{9} = 36$
- Trung bình của Y: $\bar{Y} = \frac{\sum Y}{n} = \frac{66}{9} \approx 7.333$
- Tổng các tích X*Y: $\sum XY = (27 \times 5) + (30 \times 6) + (30 \times 6) + (33 \times 8) + (33 imes 7) + (39 imes 7) + (42 imes 8) + (45 imes 9) + (45 imes 10) = 135 + 180 + 180 + 264 + 231 + 273 + 336 + 405 + 450 = 2454$
- Tổng bình phương X: $\sum X^2 = 27^2 + 30^2 + 30^2 + 33^2 + 33^2 + 39^2 + 42^2 + 45^2 + 45^2 = 729 + 900 + 900 + 1089 + 1089 + 1521 + 1764 + 2025 + 2025 = 12042$
Công thức tính hệ số góc $b$: $b = \frac{n(\sum XY) - (\sum X)(\sum Y)}{n(\sum X^2) - (\sum X)^2}$
$b = \frac{9(2454) - (324)(66)}{9(12042) - (324)^2} = \frac{22086 - 21384}{108378 - 104976} = \frac{702}{3402} \approx 0.2063$
Công thức tính hệ số chặn $a$: $a = \bar{Y} - b\bar{X}$
$a = 7.333 - (0.2063)(36) \approx 7.333 - 7.4268 \approx -0.0938$
Vậy, hàm hồi quy tuyến tính thực nghiệm là: $\hat{Y} = -0.0938 + 0.2063X$
Kết luận: Có thể dự đoán được điểm số trung bình của sinh viên qua số giờ tự học bằng hàm hồi quy tuyến tính thực nghiệm. Hàm hồi quy tuyến tính thực nghiệm là $\hat{Y} = -0.0938 + 0.2063X$.
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy
89 tài liệu310 lượt tải

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin
125 tài liệu441 lượt tải

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông
104 tài liệu687 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán
103 tài liệu589 lượt tải

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp
377 tài liệu1030 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
99 tài liệu1062 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng