JavaScript is required

Số liệu thống kê về số lượng người nhiễm Covid trong cả nước từ 25/5/2021 đến ngày 26/6/2021 được cho ở bảng số liệu sau:

Số ca mắc 0- 50 50-100 100-150 150-200 200-500
Số ngày 12 6 6 5 3

Những ngày có số ca mắc mới từ 100 ca trở lên, được gọi là những ngày “cao điểm”.

a) Với độ tin cậy 98%, hãy ước lượng số ca mắc Covid mới trung bình trong ngày?

b) Với độ tin cậy 95%, hãy ước lượng tỷ lệ tối đa của những ngày cao điểm?

c) Nếu muốn sai số gặp phải là 7%, khi ước lượng tỷ lệ “ngày cao điểm” mắc Covid, với độ tin cậy là 98% thì cần phải thống kê tối thiểu bao nhiêu ngày?

d) Trước đây độ phân tán của số ca mới mắc Covid là 50 ca, hiện nay dịch bệnh đã lan toả nhiều nơi. Với mức ý nghĩa 5%, có thể cho rằng độ ổn định của số ca mắc mới Covid đã suy giảm?

e) Tại thời điểm điều tra, số ca mắc mới Covid tại Bắc Giang trung bình là 200 ca/ ngày. Với mức ý nghĩa 5%, có thể cho rằng mức độ khống chế dịch Covid trên cả nước tốt hơn ở Bắc Giang?

Trả lời:

Đáp án đúng:


Câu hỏi này bao gồm 5 phần (a, b, c, d, e) yêu cầu áp dụng các kiến thức về thống kê suy luận, bao gồm ước lượng khoảng, kiểm định giả thuyết và xác định cỡ mẫu. **Phân tích từng phần:** * **Phần a: Ước lượng số ca mắc Covid trung bình với độ tin cậy 98%** * Dữ liệu cho là tần số theo các khoảng. * Cần tính giá trị trung bình của mẫu (x̄) và độ lệch chuẩn của mẫu (s). * Vì cỡ mẫu lớn (tổng số ngày là 12+6+6+5+3 = 32 > 30), ta có thể sử dụng phân phối chuẩn. * Công thức ước lượng khoảng cho trung bình với độ tin cậy 1-α là: x̄ ± t(n-1, α/2) * (s/√n) hoặc x̄ ± z(α/2) * (s/√n). * Với độ tin cậy 98%, α = 0.02, α/2 = 0.01. Giá trị t hoặc z tương ứng cần được tra bảng. * Để tính x̄ và s từ dữ liệu nhóm, ta lấy trung điểm của mỗi khoảng. Trung điểm khoảng 0-50 là 25, 50-100 là 75, 100-150 là 125, 150-200 là 175, 200-500 là 350 (hoặc có thể chọn trung điểm 350 là hợp lý cho khoảng cuối). Sau đó, nhân với tần số tương ứng để tính tổng, từ đó suy ra x̄ và s. * **Phần b: Ước lượng tỷ lệ tối đa của những ngày cao điểm với độ tin cậy 95%** * Ngày cao điểm là ngày có số ca mắc mới từ 100 ca trở lên. Các khoảng tương ứng là 100-150, 150-200, 200-500. * Số ngày cao điểm = 6 (100-150) + 5 (150-200) + 3 (200-500) = 14 ngày. * Tổng số ngày là 32. * Tỷ lệ ngày cao điểm trong mẫu là p̂ = 14/32. * Cần ước lượng tỷ lệ tối đa, tức là ước lượng khoảng cho tỷ lệ với sai số biên là dương. Công thức là p̂ ± z(α/2) * √(p̂(1-p̂)/n). * Với độ tin cậy 95%, α = 0.05, α/2 = 0.025. Giá trị z(0.025) = 1.96. * Sai số biên cần tính là z(α/2) * √(p̂(1-p̂)/n). * **Phần c: Xác định cỡ mẫu tối thiểu để ước lượng tỷ lệ ngày cao điểm với sai số 7% và độ tin cậy 98%** * Đã biết tỷ lệ ngày cao điểm từ phần b là p̂ = 14/32 ≈ 0.4375. * Sai số mong muốn (E) = 0.07. * Độ tin cậy 98% => α = 0.02, α/2 = 0.01. Giá trị z(0.01) cần tra bảng. * Công thức tính cỡ mẫu tối thiểu cho tỷ lệ là: n = (z(α/2)² * p̂(1-p̂)) / E². * Nếu không có ước lượng ban đầu cho p̂, ta có thể dùng p̂ = 0.5 để có cỡ mẫu lớn nhất. * **Phần d: Kiểm định giả thuyết về độ phân tán của số ca mắc mới** * So sánh độ phân tán hiện tại với độ phân tán trước đây (σ₀² = 50²). Tuy nhiên, câu hỏi cho "độ phân tán của số ca mới mắc Covid là 50 ca" - điều này có thể hiểu là độ lệch chuẩn trước đây là 50, hay phương sai trước đây là 50? Giả sử đó là phương sai (σ₀² = 50). * Dữ liệu hiện tại cho thấy số ca mắc trung bình theo ngày. Cần tính phương sai của mẫu hiện tại (s²). * Kiểm định giả thuyết về phương sai sử dụng kiểm định Chi-bình phương (χ²). * Giả thuyết không H₀: σ² = 50 (hoặc σ = √50). * Giả thuyết đối H₁: σ² > 50 (độ ổn định suy giảm có thể hiểu là phương sai tăng lên). * Mức ý nghĩa α = 0.05. * Số bậc tự do (df) = n-1 = 32-1 = 31. * Giá trị thống kê kiểm định: χ² = ((n-1) * s²) / σ₀². * So sánh giá trị tính được với giá trị tới hạn từ bảng phân phối χ² với df=31 và α=0.05 (kiểm định một phía). * **Phần e: So sánh mức độ khống chế dịch Covid** * So sánh trung bình số ca mắc mới ở Bắc Giang (200 ca/ngày) với trung bình số ca mắc mới trên cả nước (tính từ dữ liệu bảng). * Mức ý nghĩa α = 0.05. * Đây là bài toán so sánh hai trung bình, nhưng ta chỉ có một mẫu cho cả nước và một giá trị trung bình cho Bắc Giang. Có thể hiểu câu hỏi là: Liệu trung bình số ca mắc mới trên cả nước có nhỏ hơn 200 hay không? * Hoặc, so sánh trung bình mẫu của cả nước với giá trị cho trước (200). Đây là bài toán kiểm định giả thuyết cho một trung bình. * Giả thuyết không H₀: μ_cả nước = 200 (hoặc μ_cả nước ≥ 200 nếu muốn nói khống chế tốt hơn). * Giả thuyết đối H₁: μ_cả nước < 200 (để kết luận khống chế tốt hơn ở cả nước). * Sử dụng giá trị trung bình mẫu của cả nước (tính ở phần a) và độ lệch chuẩn mẫu của cả nước (tính ở phần a). * Nếu cỡ mẫu lớn, sử dụng kiểm định Z: Z = (x̄_cả nước - 200) / (s_cả nước / √n). * So sánh Z tính được với giá trị tới hạn từ phân phối chuẩn với α = 0.05 (kiểm định một phía). **Lưu ý:** Để đưa ra đáp án cụ thể, cần thực hiện các phép tính chi tiết cho từng phần. Do đề bài yêu cầu phân tích và giải thích, và không có các lựa chọn đáp án A, B, C, D để chọn, nên "answer_iscorrect" sẽ được để là null và giải thích rõ lý do. **Đánh giá chung:** Câu hỏi này kiểm tra khả năng áp dụng các công cụ thống kê suy luận vào phân tích dữ liệu thực tế. Việc giải quyết cần sự cẩn thận trong việc lựa chọn công thức, tra bảng và diễn giải kết quả.

This document is an exam paper for the "Toán kinh tế 2 - MAT11A" course, consisting of four problems. The problems cover topics in probability and statistics, including conditional probability, expected value and standard deviation of combined random variables, normal distribution applications, confidence intervals for mean and proportion, sample size determination, and hypothesis testing for variance and mean, with some questions related to COVID-19 data analysis.


4 câu hỏi 90 phút

Câu hỏi liên quan