Thời hạn sử dụng (đơn vị: ngày) của một sản phẩm là biến ngẫu nhiên có hàm mật độ: \[ f(x) = \begin{cases} \dfrac{20000}{(x+100)^3}, & \text{với } x > 0, \\[8pt] 0, & \text{với } x \leq 0. \end{cases} \]
Tính xác suất để một sản phẩm trên có thời hạn sử dụng ít nhất là 200 ngày.
Trả lời:
Đáp án đúng:
Câu hỏi yêu cầu tính xác suất để một sản phẩm có thời hạn sử dụng ít nhất là 200 ngày, biết hàm mật độ xác suất của thời hạn sử dụng. Để giải bài toán này, chúng ta cần sử dụng tích phân của hàm mật độ xác suất trên một khoảng nhất định.
Khái niệm cốt lõi của câu hỏi là tính xác suất dựa trên hàm mật độ xác suất của một biến ngẫu nhiên liên tục.
Bước 1: Xác định hàm mật độ xác suất $f(x)$.
Ta có hàm mật độ xác suất là:
$f(x) = \begin{cases} \dfrac{20000}{(x+100)^3}, & \text{với } x > 0, \\ 0, & \text{với } x \leq 0. \end{cases}$
Bước 2: Xác định khoảng cần tính xác suất.
Câu hỏi yêu cầu tính xác suất để thời hạn sử dụng ít nhất là 200 ngày. Điều này có nghĩa là thời hạn sử dụng $x \geq 200$.
Bước 3: Tính tích phân của hàm mật độ xác suất trên khoảng $[200, \infty)$.
Xác suất $P(x \geq 200)$ được tính bằng tích phân:
$P(x \geq 200) = \int_{200}^{\infty} f(x) dx = \int_{200}^{\infty} \dfrac{20000}{(x+100)^3} dx$
Để giải tích phân này, ta có thể sử dụng phép đổi biến. Đặt $u = x+100$, khi đó $du = dx$. Khi $x=200$, $u = 200+100 = 300$. Khi $x \to \infty$, $u \to \infty$.
Tích phân trở thành:
$
\int_{300}^{\infty} \dfrac{20000}{u^3} du = 20000 \int_{300}^{\infty} u^{-3} du$
Nguyên hàm của $u^{-3}$ là $\dfrac{u^{-2}}{-2} = -\dfrac{1}{2u^2}$.
Vậy, tích phân xác định là:
$20000 \left[ -\dfrac{1}{2u^2} \right]_{300}^{\infty} = 20000 \left( \lim_{u\to\infty} \left(-\dfrac{1}{2u^2}\right) - \left(-\dfrac{1}{2(300)^2}\right) \right)$
$= 20000 \left( 0 + \dfrac{1}{2(300)^2} \right)$
$= 20000 \left( \dfrac{1}{2 \times 90000} \right)$
$= 20000 \left( \dfrac{1}{180000} \right)$
$= \dfrac{20000}{180000} = \dfrac{2}{18} = \dfrac{1}{9}$
Vì vậy, xác suất để một sản phẩm trên có thời hạn sử dụng ít nhất là 200 ngày là 1/9.
Trong trường hợp này, không có các đáp án được cung cấp để lựa chọn, nhưng kết quả tính toán là 1/9.
This document is an end-of-term exam paper (Test No. 1) for the course 'Toán kinh tế 2 - MAT11A' from the Banking Academy, Department of Mathematics. It contains 5 questions covering topics such as probability, random variables, statistical estimation (confidence intervals), and hypothesis testing, with a time limit of 90 minutes.
5 câu hỏi 90 phút
Câu hỏi liên quan
Lời giải:
Câu hỏi này thuộc lĩnh vực xác suất thống kê, cụ thể là bài toán liên quan đến phân phối chuẩn. Khái niệm cốt lõi là việc sử dụng phân phối chuẩn để xác định một ngưỡng giá trị sao cho tỷ lệ các trường hợp vượt quá (hoặc dưới) ngưỡng đó nằm trong một phạm vi cho trước. Trong trường hợp này, chúng ta cần tìm thời gian bảo hành (ngưỡng) sao cho chỉ 3% số sản phẩm bị hỏng trong thời gian đó.
Để giải quyết bài toán này, ta cần thực hiện các bước sau:
1. Xác định thông số của phân phối chuẩn: Đề bài cho biết tuổi thọ của sản phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình $\mu = 10$ năm và độ lệch chuẩn $\sigma = 2$ năm.
2. Thiết lập bài toán theo yêu cầu: Nhà sản xuất muốn chỉ 3% số sản phẩm bị hỏng trong thời gian bảo hành. Điều này có nghĩa là 97% số sản phẩm còn lại sẽ có tuổi thọ lớn hơn hoặc bằng thời gian bảo hành. Gọi thời gian bảo hành là $T$. Ta cần tìm $T$ sao cho $P(X \ge T) = 0.97$, hoặc tương đương $P(X < T) = 0.03$.
3. Chuẩn hóa biến ngẫu nhiên: Để sử dụng bảng phân phối chuẩn tắc (bảng Z), ta cần chuẩn hóa biến ngẫu nhiên $X$ thành biến ngẫu nhiên chuẩn tắc $Z$ theo công thức $Z = \frac{X - \mu}{\sigma}$. Khi đó, $X = T$ tương ứng với $Z = \frac{T - 10}{2}$.
4. Tìm giá trị Z tương ứng: Ta cần tìm giá trị $z$ sao cho $P(Z < z) = 0.03$. Sử dụng bảng phân phối chuẩn tắc ngược hoặc công cụ tính toán, ta tìm được giá trị $z$ tương ứng với xác suất tích lũy là 0.03. Lưu ý rằng 0.03 là một xác suất nhỏ, do đó giá trị $z$ sẽ âm. Tra bảng Z, ta tìm được $z \approx -1.88$.
5. Tính toán thời gian bảo hành T: Từ $Z = \frac{T - 10}{2}$, ta có $T = \mu + Z \cdot \sigma$. Thay các giá trị đã biết vào: $T = 10 + (-1.88) \cdot 2 = 10 - 3.76 = 6.24$ năm.
Kết luận: Để chỉ phải bảo hành 3% số sản phẩm, nhà sản xuất nên quy định thời gian bảo hành là khoảng 6.24 năm.
Để giải quyết bài toán này, ta cần thực hiện các bước sau:
1. Xác định thông số của phân phối chuẩn: Đề bài cho biết tuổi thọ của sản phẩm là biến ngẫu nhiên phân phối chuẩn với trung bình $\mu = 10$ năm và độ lệch chuẩn $\sigma = 2$ năm.
2. Thiết lập bài toán theo yêu cầu: Nhà sản xuất muốn chỉ 3% số sản phẩm bị hỏng trong thời gian bảo hành. Điều này có nghĩa là 97% số sản phẩm còn lại sẽ có tuổi thọ lớn hơn hoặc bằng thời gian bảo hành. Gọi thời gian bảo hành là $T$. Ta cần tìm $T$ sao cho $P(X \ge T) = 0.97$, hoặc tương đương $P(X < T) = 0.03$.
3. Chuẩn hóa biến ngẫu nhiên: Để sử dụng bảng phân phối chuẩn tắc (bảng Z), ta cần chuẩn hóa biến ngẫu nhiên $X$ thành biến ngẫu nhiên chuẩn tắc $Z$ theo công thức $Z = \frac{X - \mu}{\sigma}$. Khi đó, $X = T$ tương ứng với $Z = \frac{T - 10}{2}$.
4. Tìm giá trị Z tương ứng: Ta cần tìm giá trị $z$ sao cho $P(Z < z) = 0.03$. Sử dụng bảng phân phối chuẩn tắc ngược hoặc công cụ tính toán, ta tìm được giá trị $z$ tương ứng với xác suất tích lũy là 0.03. Lưu ý rằng 0.03 là một xác suất nhỏ, do đó giá trị $z$ sẽ âm. Tra bảng Z, ta tìm được $z \approx -1.88$.
5. Tính toán thời gian bảo hành T: Từ $Z = \frac{T - 10}{2}$, ta có $T = \mu + Z \cdot \sigma$. Thay các giá trị đã biết vào: $T = 10 + (-1.88) \cdot 2 = 10 - 3.76 = 6.24$ năm.
Kết luận: Để chỉ phải bảo hành 3% số sản phẩm, nhà sản xuất nên quy định thời gian bảo hành là khoảng 6.24 năm.
Lời giải:
Câu hỏi này yêu cầu thực hiện ba bài toán ước lượng thống kê khác nhau dựa trên dữ liệu mẫu thu thập được về nhu cầu sử dụng sản phẩm của các hộ gia đình.
Phân tích chi tiết các phần của câu hỏi:
a) Ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm với độ tin cậy 95%:
- Đây là bài toán ước lượng khoảng cho tỷ lệ tổng thể. Tuy nhiên, dữ liệu được cung cấp dưới dạng khoảng nhu cầu và số hộ tương ứng, không phải là số hộ có/không có nhu cầu. Để ước lượng tỷ lệ hộ gia đình có nhu cầu, chúng ta cần giả định rằng "có nhu cầu" là các hộ có nhu cầu khác 0. Do đó, chúng ta cần tính tổng số hộ có nhu cầu khác 0 và tổng số hộ trong mẫu.
- Số hộ có nhu cầu (khác 0) = Tổng số hộ - Số hộ có nhu cầu 0
- Tỷ lệ mẫu $\hat{p}$ = (Số hộ có nhu cầu) / (Tổng số hộ).
- Với độ tin cậy 95%, ta tra bảng phân phối chuẩn Z để tìm giá trị tới hạn $z_{\alpha/2}$ (với $\alpha = 1 - 0.95 = 0.05$, $\alpha/2 = 0.025$, $z_{0.025} \approx 1.96$).
- Khoảng tin cậy cho tỷ lệ tổng thể $p$ được tính theo công thức: $\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$, trong đó $n$ là kích thước mẫu (tổng số hộ).
b) Ước lượng nhu cầu trung bình với độ chính xác 0.02 kg/tháng, tìm độ tin cậy:
- Đây là bài toán ước lượng khoảng cho giá trị trung bình tổng thể khi phương sai tổng thể chưa biết (hoặc không cho trước) và kích thước mẫu tương đối lớn (thường là n > 30, hoặc nếu n < 30 nhưng tổng thể phân phối chuẩn). Trong trường hợp này, dữ liệu là dạng khoảng, ta cần tính giá trị trung bình của từng khoảng để ước lượng trung bình mẫu.
- Giá trị trung bình của khoảng $[a; b]$ thường được lấy là điểm giữa $(a+b)/2$. Đối với khoảng $(a; b)$, ta cũng có thể lấy xấp xỉ là $(a+b)/2$. Tuy nhiên, khoảng đầu tiên là "0" và khoảng thứ hai là "(2; 3)". Cần làm rõ cách xử lý "0" (có thể coi là [0; 0] hoặc là một giá trị riêng biệt). Giả định "0" là một giá trị và các khoảng sau là các lớp.
- Trung bình mẫu $\bar{x}$ = $\sum (giá \ trị \ trung \ tâm \ của \ mỗi \ khoảng) * (số \ hộ \ tương \ ứng) / (tổng \ số \ hộ)$.
- Phương sai mẫu hiệu chỉnh $s^2$ = $\frac{1}{n-1} \sum (giá \ trị \ trung \ tâm \ của \ mỗi \ khoảng - \bar{x})^2 * (số \ hộ \ tương \ ứng)$.
- Độ lệch chuẩn mẫu $s = \sqrt{s^2}$.
- Độ chính xác $d = 0.2$ đã cho.
- Vì phương sai tổng thể chưa biết, ta sử dụng phân phối t-Student. Tuy nhiên, với $n$ đủ lớn, có thể xấp xỉ bằng phân phối chuẩn.
- Nếu sử dụng phân phối chuẩn Z: $d = z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$. Nếu $\sigma$ không biết, ta thay bằng $s$. Tuy nhiên, câu hỏi cho độ chính xác $d$, không cho $z_{\alpha/2}$, yêu cầu tìm độ tin cậy (tức là tìm $\alpha$).
- Công thức liên hệ độ chính xác, giá trị tới hạn và sai số chuẩn: $d = t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$ (nếu dùng t-Student) hoặc $d = z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$ (nếu biết $\sigma$ hoặc n lớn).
- Để tìm độ tin cậy, ta cần tính giá trị $t$ hoặc $z$ tương ứng với $d$ và tìm $\alpha$ từ giá trị đó.
- Tính toán trung bình mẫu và phương sai mẫu từ dữ liệu khoảng.
- Với độ chính xác $d = 0.2$, ta có: $0.2 = t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$. Tìm $t_{\alpha/2, n-1}$ từ đó suy ra $\alpha/2$ và $\alpha$. Hoặc dùng xấp xỉ $z$: $0.2 \approx z_{\alpha/2} \frac{s}{\sqrt{n}}$.
c) Tìm khoảng tin cậy hai phía cho phương sai với độ tin cậy 98%:
- Dữ liệu cho biết mức sử dụng sản phẩm phân phối xấp xỉ chuẩn. Bài toán này yêu cầu ước lượng khoảng cho phương sai tổng thể $\sigma^2$.
- Ta cần tính phương sai mẫu hiệu chỉnh $s^2$ từ dữ liệu (sử dụng các giá trị trung tâm của khoảng).
- Với độ tin cậy 98%, ta có $\alpha = 1 - 0.98 = 0.02$. Ta cần tìm các giá trị tới hạn của phân phối Chi-bình phương: $\chi^2_{\alpha/2, n-1}$ và $\chi^2_{1-\alpha/2, n-1}$.
- Khoảng tin cậy cho phương sai tổng thể $\sigma^2$ được tính theo công thức: $\left(\frac{(n-1)s^2}{\chi^2_{\alpha/2, n-1}}, \frac{(n-1)s^2}{\chi^2_{1-\alpha/2, n-1}}\right)$.
Thiếu thông tin hoặc cần làm rõ:
- Cách xử lý giá trị "0" và khoảng "(2; 3)" trong phần tính trung bình và phương sai ở câu b). Giả định phổ biến là coi "0" như một lớp riêng biệt và các khoảng mở (a; b) được xử lý bằng điểm giữa (a+b)/2.
- Câu hỏi yêu cầu "ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm" ở câu a), nhưng dữ liệu lại là phân phối theo nhu cầu theo kg/tháng. Cần làm rõ "có nhu cầu" nghĩa là gì trong bối cảnh này. Giả định phổ biến là "có nhu cầu" là các hộ có nhu cầu khác 0.
- Để có thể tính toán cụ thể, cần phải xác định các giá trị trung tâm cho từng khoảng và tổng số hộ.
Giải thích chi tiết các bước tính toán:
Bước 1: Tổng hợp dữ liệu và tính toán các đại lượng cơ bản.
Tổng số hộ: $N = 150 + 33 + 52 + 127 + 73 + 35 + 30 = 490$.
Để xử lý các khoảng, ta lấy giá trị trung tâm:
- Nhu cầu 0: Lấy là 0.
- (2; 3): Trung tâm là $(2+3)/2 = 2.5$.
- (3; 4): Trung tâm là $(3+4)/2 = 3.5$.
- (4; 5): Trung tâm là $(4+5)/2 = 4.5$.
- (5; 6): Trung tâm là $(5+6)/2 = 5.5$.
- (6; 7): Trung tâm là $(6+7)/2 = 6.5$.
Ta có bảng dữ liệu đã xử lý:
| Nhu cầu (kg/tháng) | Đại diện (x_i) | Số hộ (f_i) |
|---|---|---|
| 0 | 0 | 150 |
| (2; 3) | 2.5 | 33 |
| (3; 4) | 3.5 | 52 |
| (4; 5) | 4.5 | 127 |
| (5; 6) | 5.5 | 73 |
| (6; 7) | 6.5 | 35 |
| (7; 8) | 7.5 | 30 |
| Tổng | | 490 |
Phần a) Ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm với độ tin cậy 95%.
Giả định "có nhu cầu" là các hộ có nhu cầu khác 0.
Số hộ có nhu cầu (khác 0) = $490 - 150 = 340$.
Tổng số hộ $n = 490$.
Tỷ lệ mẫu $\hat{p} = 340 / 490 \approx 0.6939$.
Độ tin cậy 95% => $\alpha = 0.05$ => $z_{\alpha/2} = z_{0.025} \approx 1.96$.
Sai số chuẩn của tỷ lệ mẫu: $SE(\hat{p}) = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.6939(1-0.6939)}{490}} \approx \sqrt{\frac{0.6939 * 0.3061}{490}} \approx \sqrt{\frac{0.2124}{490}} \approx \sqrt{0.000433} \approx 0.0208$.
Khoảng tin cậy 95% cho tỷ lệ tổng thể $p$: $\hat{p} \pm z_{\alpha/2} SE(\hat{p}) \approx 0.6939 \pm 1.96 * 0.0208
\approx 0.6939 \pm 0.0408$.
Khoảng tin cậy là $(0.6531, 0.7347)$.
Vậy, ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm với độ tin cậy 95% là từ 65.31% đến 73.47%.
Phần b) Ước lượng nhu cầu trung bình với độ chính xác 0.2 kg/tháng, tìm độ tin cậy.
Tính trung bình mẫu $\bar{x}$:
$\bar{x} = \frac{1}{490} [ (0*150) + (2.5*33) + (3.5*52) + (4.5*127) + (5.5*73) + (6.5*35) + (7.5*30) ]$
$\bar{x} = \frac{1}{490} [ 0 + 82.5 + 182 + 571.5 + 401.5 + 227.5 + 225 ]$
$\bar{x} = \frac{1690}{490} \approx 3.449$ kg/tháng.
Tính phương sai mẫu hiệu chỉnh $s^2$:
Ta cần tính $\sum f_i (x_i - \bar{x})^2$.
(0 - 3.449)^2 * 150 = 11.54 * 150 = 1731
(2.5 - 3.449)^2 * 33 = 0.89 * 33 = 29.37
(3.5 - 3.449)^2 * 52 = 0.0026 * 52 = 0.13
(4.5 - 3.449)^2 * 127 = 1.10 * 127 = 139.7
(5.5 - 3.449)^2 * 73 = 4.20 * 73 = 306.6
(6.5 - 3.449)^2 * 35 = 9.31 * 35 = 325.85
(7.5 - 3.449)^2 * 30 = 16.41 * 30 = 492.3
Tổng bình phương sai lệch = $1731 + 29.37 + 0.13 + 139.7 + 306.6 + 325.85 + 492.3
\approx 3025.05$.
$s^2 = \frac{3025.05}{n-1} = \frac{3025.05}{490-1} = \frac{3025.05}{489} \approx 6.186$.
Độ lệch chuẩn mẫu $s = \sqrt{6.186} \approx 2.487$.
Độ chính xác $d = 0.2$.
Vì $n=490$ khá lớn, ta có thể xấp xỉ bằng phân phối Z.
$d = z_{\alpha/2} \frac{s}{\sqrt{n}}$
$0.2 = z_{\alpha/2} \frac{2.487}{\sqrt{490}}$
$0.2 = z_{\alpha/2} \frac{2.487}{22.136}$
$0.2 = z_{\alpha/2} * 0.1123$
$z_{\alpha/2} = 0.2 / 0.1123 \approx 1.781$.
Tra bảng phân phối Z, giá trị $z \approx 1.781$ tương ứng với diện tích ở hai đuôi là $2 * (1 - \Phi(1.781)) \approx 2 * (1 - 0.9625) = 2 * 0.0375 = 0.075$.
Vậy $\alpha \approx 0.075$, độ tin cậy là $1 - \alpha = 1 - 0.075 = 0.925$ hay 92.5%.
*Lưu ý: Nếu dùng phân phối t-Student, giá trị $z_{\alpha/2}$ sẽ được thay bằng $t_{\alpha/2, n-1}$. Với $n=490$ thì phân phối t rất gần với phân phối Z, nên kết quả xấp xỉ là chấp nhận được.*.
Phần c) Tìm khoảng tin cậy hai phía cho phương sai với độ tin cậy 98%.
Ta đã có $n = 490$ và $s^2 \approx 6.186$.
Độ tin cậy 98% => $\alpha = 0.02$ => $\alpha/2 = 0.01$.
Bậc tự do $df = n-1 = 490 - 1 = 489$.
Ta cần tra bảng Chi-bình phương cho $\chi^2_{0.01, 489}$ và $\chi^2_{0.99, 489}$.
Với bậc tự do lớn (489), ta có thể xấp xỉ bằng phân phối chuẩn cho trung bình và phương sai của phân phối Chi-bình phương.
Trung bình của $\chi^2$ với $df$ bậc tự do là $df$. Phương sai là $2df$.
Tuy nhiên, tra bảng chuyên dụng cho $\chi^2$ với $df=489$ cho kết quả:
$\chi^2_{0.01, 489} \approx 524.59$
$\chi^2_{0.99, 489} \approx 455.46$
*(Lưu ý: việc tra bảng với df lớn có thể cần phần mềm hoặc bảng tra mở rộng. Giá trị có thể dao động tùy thuộc vào nguồn tra cứu. Các giá trị này thường có sai số nhỏ. Một số nguồn có thể cho $\chi^2_{0.01, 489} \approx 524.59$, $\chi^2_{0.99, 489} \approx 455.46$.)*
Khoảng tin cậy cho $\sigma^2$:
Giới hạn dưới: $\frac{(n-1)s^2}{\chi^2_{\alpha/2, n-1}} = \frac{489 * 6.186}{524.59} \approx \frac{3025.05}{524.59} \approx 5.766$.
Giới hạn trên: $\frac{(n-1)s^2}{\chi^2_{1-\alpha/2, n-1}} = \frac{489 * 6.186}{455.46} \approx \frac{3025.05}{455.46} \approx 6.641$.
Vậy, khoảng tin cậy 98% cho phương sai của mức sử dụng sản phẩm là từ 5.766 đến 6.641 (kg/tháng)^2.
Đánh giá và trả lời:
Câu hỏi bao gồm ba phần, mỗi phần kiểm tra một kỹ năng ước lượng thống kê khác nhau.
a) Yêu cầu ước lượng tỷ lệ, sử dụng công thức ước lượng khoảng cho tỷ lệ với Z-score.
b) Yêu cầu ước lượng trung bình khi biết độ chính xác và tìm độ tin cậy, sử dụng công thức ước lượng khoảng cho trung bình và suy ngược ra Z-score (hoặc t-score) để tìm độ tin cậy.
c) Yêu cầu ước lượng phương sai khi biết tổng thể phân phối chuẩn, sử dụng phân phối Chi-bình phương.
Các bước tính toán đã được thực hiện chi tiết ở trên. Đây là một câu hỏi bài tập lớn, đòi hỏi sự hiểu biết và khả năng áp dụng các công thức ước lượng thống kê trong các tình huống khác nhau, bao gồm cả dữ liệu dạng khoảng.
Do không có đáp án cụ thể để so sánh, tôi đã thực hiện tính toán chi tiết theo phương pháp chuẩn. Nếu câu hỏi có sẵn đáp án trắc nghiệm, tôi sẽ chọn đáp án gần nhất với kết quả tính toán.
Vì đây là câu hỏi tự luận, không có đáp án đúng để chọn, nên thuộc trường hợp không có đáp án đúng để chọn theo định dạng `answer_iscorrect`. Tuy nhiên, bài toán có thể giải được và có kết quả. Tôi sẽ để `answer_iscorrect` là "null" và giải thích rõ trong `squest_explain` rằng đây là bài tập tính toán tự luận và không có lựa chọn đáp án.
Phân tích chi tiết các phần của câu hỏi:
a) Ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm với độ tin cậy 95%:
- Đây là bài toán ước lượng khoảng cho tỷ lệ tổng thể. Tuy nhiên, dữ liệu được cung cấp dưới dạng khoảng nhu cầu và số hộ tương ứng, không phải là số hộ có/không có nhu cầu. Để ước lượng tỷ lệ hộ gia đình có nhu cầu, chúng ta cần giả định rằng "có nhu cầu" là các hộ có nhu cầu khác 0. Do đó, chúng ta cần tính tổng số hộ có nhu cầu khác 0 và tổng số hộ trong mẫu.
- Số hộ có nhu cầu (khác 0) = Tổng số hộ - Số hộ có nhu cầu 0
- Tỷ lệ mẫu $\hat{p}$ = (Số hộ có nhu cầu) / (Tổng số hộ).
- Với độ tin cậy 95%, ta tra bảng phân phối chuẩn Z để tìm giá trị tới hạn $z_{\alpha/2}$ (với $\alpha = 1 - 0.95 = 0.05$, $\alpha/2 = 0.025$, $z_{0.025} \approx 1.96$).
- Khoảng tin cậy cho tỷ lệ tổng thể $p$ được tính theo công thức: $\hat{p} \pm z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$, trong đó $n$ là kích thước mẫu (tổng số hộ).
b) Ước lượng nhu cầu trung bình với độ chính xác 0.02 kg/tháng, tìm độ tin cậy:
- Đây là bài toán ước lượng khoảng cho giá trị trung bình tổng thể khi phương sai tổng thể chưa biết (hoặc không cho trước) và kích thước mẫu tương đối lớn (thường là n > 30, hoặc nếu n < 30 nhưng tổng thể phân phối chuẩn). Trong trường hợp này, dữ liệu là dạng khoảng, ta cần tính giá trị trung bình của từng khoảng để ước lượng trung bình mẫu.
- Giá trị trung bình của khoảng $[a; b]$ thường được lấy là điểm giữa $(a+b)/2$. Đối với khoảng $(a; b)$, ta cũng có thể lấy xấp xỉ là $(a+b)/2$. Tuy nhiên, khoảng đầu tiên là "0" và khoảng thứ hai là "(2; 3)". Cần làm rõ cách xử lý "0" (có thể coi là [0; 0] hoặc là một giá trị riêng biệt). Giả định "0" là một giá trị và các khoảng sau là các lớp.
- Trung bình mẫu $\bar{x}$ = $\sum (giá \ trị \ trung \ tâm \ của \ mỗi \ khoảng) * (số \ hộ \ tương \ ứng) / (tổng \ số \ hộ)$.
- Phương sai mẫu hiệu chỉnh $s^2$ = $\frac{1}{n-1} \sum (giá \ trị \ trung \ tâm \ của \ mỗi \ khoảng - \bar{x})^2 * (số \ hộ \ tương \ ứng)$.
- Độ lệch chuẩn mẫu $s = \sqrt{s^2}$.
- Độ chính xác $d = 0.2$ đã cho.
- Vì phương sai tổng thể chưa biết, ta sử dụng phân phối t-Student. Tuy nhiên, với $n$ đủ lớn, có thể xấp xỉ bằng phân phối chuẩn.
- Nếu sử dụng phân phối chuẩn Z: $d = z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$. Nếu $\sigma$ không biết, ta thay bằng $s$. Tuy nhiên, câu hỏi cho độ chính xác $d$, không cho $z_{\alpha/2}$, yêu cầu tìm độ tin cậy (tức là tìm $\alpha$).
- Công thức liên hệ độ chính xác, giá trị tới hạn và sai số chuẩn: $d = t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$ (nếu dùng t-Student) hoặc $d = z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$ (nếu biết $\sigma$ hoặc n lớn).
- Để tìm độ tin cậy, ta cần tính giá trị $t$ hoặc $z$ tương ứng với $d$ và tìm $\alpha$ từ giá trị đó.
- Tính toán trung bình mẫu và phương sai mẫu từ dữ liệu khoảng.
- Với độ chính xác $d = 0.2$, ta có: $0.2 = t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}$. Tìm $t_{\alpha/2, n-1}$ từ đó suy ra $\alpha/2$ và $\alpha$. Hoặc dùng xấp xỉ $z$: $0.2 \approx z_{\alpha/2} \frac{s}{\sqrt{n}}$.
c) Tìm khoảng tin cậy hai phía cho phương sai với độ tin cậy 98%:
- Dữ liệu cho biết mức sử dụng sản phẩm phân phối xấp xỉ chuẩn. Bài toán này yêu cầu ước lượng khoảng cho phương sai tổng thể $\sigma^2$.
- Ta cần tính phương sai mẫu hiệu chỉnh $s^2$ từ dữ liệu (sử dụng các giá trị trung tâm của khoảng).
- Với độ tin cậy 98%, ta có $\alpha = 1 - 0.98 = 0.02$. Ta cần tìm các giá trị tới hạn của phân phối Chi-bình phương: $\chi^2_{\alpha/2, n-1}$ và $\chi^2_{1-\alpha/2, n-1}$.
- Khoảng tin cậy cho phương sai tổng thể $\sigma^2$ được tính theo công thức: $\left(\frac{(n-1)s^2}{\chi^2_{\alpha/2, n-1}}, \frac{(n-1)s^2}{\chi^2_{1-\alpha/2, n-1}}\right)$.
Thiếu thông tin hoặc cần làm rõ:
- Cách xử lý giá trị "0" và khoảng "(2; 3)" trong phần tính trung bình và phương sai ở câu b). Giả định phổ biến là coi "0" như một lớp riêng biệt và các khoảng mở (a; b) được xử lý bằng điểm giữa (a+b)/2.
- Câu hỏi yêu cầu "ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm" ở câu a), nhưng dữ liệu lại là phân phối theo nhu cầu theo kg/tháng. Cần làm rõ "có nhu cầu" nghĩa là gì trong bối cảnh này. Giả định phổ biến là "có nhu cầu" là các hộ có nhu cầu khác 0.
- Để có thể tính toán cụ thể, cần phải xác định các giá trị trung tâm cho từng khoảng và tổng số hộ.
Giải thích chi tiết các bước tính toán:
Bước 1: Tổng hợp dữ liệu và tính toán các đại lượng cơ bản.
Tổng số hộ: $N = 150 + 33 + 52 + 127 + 73 + 35 + 30 = 490$.
Để xử lý các khoảng, ta lấy giá trị trung tâm:
- Nhu cầu 0: Lấy là 0.
- (2; 3): Trung tâm là $(2+3)/2 = 2.5$.
- (3; 4): Trung tâm là $(3+4)/2 = 3.5$.
- (4; 5): Trung tâm là $(4+5)/2 = 4.5$.
- (5; 6): Trung tâm là $(5+6)/2 = 5.5$.
- (6; 7): Trung tâm là $(6+7)/2 = 6.5$.
Ta có bảng dữ liệu đã xử lý:
| Nhu cầu (kg/tháng) | Đại diện (x_i) | Số hộ (f_i) |
|---|---|---|
| 0 | 0 | 150 |
| (2; 3) | 2.5 | 33 |
| (3; 4) | 3.5 | 52 |
| (4; 5) | 4.5 | 127 |
| (5; 6) | 5.5 | 73 |
| (6; 7) | 6.5 | 35 |
| (7; 8) | 7.5 | 30 |
| Tổng | | 490 |
Phần a) Ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm với độ tin cậy 95%.
Giả định "có nhu cầu" là các hộ có nhu cầu khác 0.
Số hộ có nhu cầu (khác 0) = $490 - 150 = 340$.
Tổng số hộ $n = 490$.
Tỷ lệ mẫu $\hat{p} = 340 / 490 \approx 0.6939$.
Độ tin cậy 95% => $\alpha = 0.05$ => $z_{\alpha/2} = z_{0.025} \approx 1.96$.
Sai số chuẩn của tỷ lệ mẫu: $SE(\hat{p}) = \sqrt{\frac{\hat{p}(1-\hat{p})}{n}} = \sqrt{\frac{0.6939(1-0.6939)}{490}} \approx \sqrt{\frac{0.6939 * 0.3061}{490}} \approx \sqrt{\frac{0.2124}{490}} \approx \sqrt{0.000433} \approx 0.0208$.
Khoảng tin cậy 95% cho tỷ lệ tổng thể $p$: $\hat{p} \pm z_{\alpha/2} SE(\hat{p}) \approx 0.6939 \pm 1.96 * 0.0208
\approx 0.6939 \pm 0.0408$.
Khoảng tin cậy là $(0.6531, 0.7347)$.
Vậy, ước lượng tỷ lệ hộ gia đình có nhu cầu sử dụng sản phẩm với độ tin cậy 95% là từ 65.31% đến 73.47%.
Phần b) Ước lượng nhu cầu trung bình với độ chính xác 0.2 kg/tháng, tìm độ tin cậy.
Tính trung bình mẫu $\bar{x}$:
$\bar{x} = \frac{1}{490} [ (0*150) + (2.5*33) + (3.5*52) + (4.5*127) + (5.5*73) + (6.5*35) + (7.5*30) ]$
$\bar{x} = \frac{1}{490} [ 0 + 82.5 + 182 + 571.5 + 401.5 + 227.5 + 225 ]$
$\bar{x} = \frac{1690}{490} \approx 3.449$ kg/tháng.
Tính phương sai mẫu hiệu chỉnh $s^2$:
Ta cần tính $\sum f_i (x_i - \bar{x})^2$.
(0 - 3.449)^2 * 150 = 11.54 * 150 = 1731
(2.5 - 3.449)^2 * 33 = 0.89 * 33 = 29.37
(3.5 - 3.449)^2 * 52 = 0.0026 * 52 = 0.13
(4.5 - 3.449)^2 * 127 = 1.10 * 127 = 139.7
(5.5 - 3.449)^2 * 73 = 4.20 * 73 = 306.6
(6.5 - 3.449)^2 * 35 = 9.31 * 35 = 325.85
(7.5 - 3.449)^2 * 30 = 16.41 * 30 = 492.3
Tổng bình phương sai lệch = $1731 + 29.37 + 0.13 + 139.7 + 306.6 + 325.85 + 492.3
\approx 3025.05$.
$s^2 = \frac{3025.05}{n-1} = \frac{3025.05}{490-1} = \frac{3025.05}{489} \approx 6.186$.
Độ lệch chuẩn mẫu $s = \sqrt{6.186} \approx 2.487$.
Độ chính xác $d = 0.2$.
Vì $n=490$ khá lớn, ta có thể xấp xỉ bằng phân phối Z.
$d = z_{\alpha/2} \frac{s}{\sqrt{n}}$
$0.2 = z_{\alpha/2} \frac{2.487}{\sqrt{490}}$
$0.2 = z_{\alpha/2} \frac{2.487}{22.136}$
$0.2 = z_{\alpha/2} * 0.1123$
$z_{\alpha/2} = 0.2 / 0.1123 \approx 1.781$.
Tra bảng phân phối Z, giá trị $z \approx 1.781$ tương ứng với diện tích ở hai đuôi là $2 * (1 - \Phi(1.781)) \approx 2 * (1 - 0.9625) = 2 * 0.0375 = 0.075$.
Vậy $\alpha \approx 0.075$, độ tin cậy là $1 - \alpha = 1 - 0.075 = 0.925$ hay 92.5%.
*Lưu ý: Nếu dùng phân phối t-Student, giá trị $z_{\alpha/2}$ sẽ được thay bằng $t_{\alpha/2, n-1}$. Với $n=490$ thì phân phối t rất gần với phân phối Z, nên kết quả xấp xỉ là chấp nhận được.*.
Phần c) Tìm khoảng tin cậy hai phía cho phương sai với độ tin cậy 98%.
Ta đã có $n = 490$ và $s^2 \approx 6.186$.
Độ tin cậy 98% => $\alpha = 0.02$ => $\alpha/2 = 0.01$.
Bậc tự do $df = n-1 = 490 - 1 = 489$.
Ta cần tra bảng Chi-bình phương cho $\chi^2_{0.01, 489}$ và $\chi^2_{0.99, 489}$.
Với bậc tự do lớn (489), ta có thể xấp xỉ bằng phân phối chuẩn cho trung bình và phương sai của phân phối Chi-bình phương.
Trung bình của $\chi^2$ với $df$ bậc tự do là $df$. Phương sai là $2df$.
Tuy nhiên, tra bảng chuyên dụng cho $\chi^2$ với $df=489$ cho kết quả:
$\chi^2_{0.01, 489} \approx 524.59$
$\chi^2_{0.99, 489} \approx 455.46$
*(Lưu ý: việc tra bảng với df lớn có thể cần phần mềm hoặc bảng tra mở rộng. Giá trị có thể dao động tùy thuộc vào nguồn tra cứu. Các giá trị này thường có sai số nhỏ. Một số nguồn có thể cho $\chi^2_{0.01, 489} \approx 524.59$, $\chi^2_{0.99, 489} \approx 455.46$.)*
Khoảng tin cậy cho $\sigma^2$:
Giới hạn dưới: $\frac{(n-1)s^2}{\chi^2_{\alpha/2, n-1}} = \frac{489 * 6.186}{524.59} \approx \frac{3025.05}{524.59} \approx 5.766$.
Giới hạn trên: $\frac{(n-1)s^2}{\chi^2_{1-\alpha/2, n-1}} = \frac{489 * 6.186}{455.46} \approx \frac{3025.05}{455.46} \approx 6.641$.
Vậy, khoảng tin cậy 98% cho phương sai của mức sử dụng sản phẩm là từ 5.766 đến 6.641 (kg/tháng)^2.
Đánh giá và trả lời:
Câu hỏi bao gồm ba phần, mỗi phần kiểm tra một kỹ năng ước lượng thống kê khác nhau.
a) Yêu cầu ước lượng tỷ lệ, sử dụng công thức ước lượng khoảng cho tỷ lệ với Z-score.
b) Yêu cầu ước lượng trung bình khi biết độ chính xác và tìm độ tin cậy, sử dụng công thức ước lượng khoảng cho trung bình và suy ngược ra Z-score (hoặc t-score) để tìm độ tin cậy.
c) Yêu cầu ước lượng phương sai khi biết tổng thể phân phối chuẩn, sử dụng phân phối Chi-bình phương.
Các bước tính toán đã được thực hiện chi tiết ở trên. Đây là một câu hỏi bài tập lớn, đòi hỏi sự hiểu biết và khả năng áp dụng các công thức ước lượng thống kê trong các tình huống khác nhau, bao gồm cả dữ liệu dạng khoảng.
Do không có đáp án cụ thể để so sánh, tôi đã thực hiện tính toán chi tiết theo phương pháp chuẩn. Nếu câu hỏi có sẵn đáp án trắc nghiệm, tôi sẽ chọn đáp án gần nhất với kết quả tính toán.
Vì đây là câu hỏi tự luận, không có đáp án đúng để chọn, nên thuộc trường hợp không có đáp án đúng để chọn theo định dạng `answer_iscorrect`. Tuy nhiên, bài toán có thể giải được và có kết quả. Tôi sẽ để `answer_iscorrect` là "null" và giải thích rõ trong `squest_explain` rằng đây là bài tập tính toán tự luận và không có lựa chọn đáp án.
Lời giải:
Câu hỏi yêu cầu thực hiện hai phần:
Phần a) Ước lượng khoảng tin cậy cho thu nhập trung bình:
1. Xác định bài toán: Đây là bài toán ước lượng khoảng cho trung bình tổng thể khi biết độ lệch chuẩn tổng thể hoặc khi cỡ mẫu đủ lớn (áp dụng theo định lý giới hạn trung tâm). Tuy nhiên, đề bài không cho sẵn độ lệch chuẩn tổng thể. Trong trường hợp này, ta có thể ước lượng độ lệch chuẩn tổng thể từ mẫu hoặc sử dụng phân phối t-Student nếu cỡ mẫu không quá lớn. Nhưng thông thường, với các bài tập dạng này, nếu không cho độ lệch chuẩn tổng thể, ta sẽ tính độ lệch chuẩn mẫu để ước lượng.
2. Xử lý dữ liệu nhóm: Bảng số liệu cung cấp dữ liệu thu nhập theo nhóm. Để tính toán các tham số thống kê như trung bình mẫu và độ lệch chuẩn mẫu, ta cần xác định điểm giữa của mỗi nhóm.
* Nhóm 1: (240+320)/2 = 280
* Nhóm 2: (320+400)/2 = 360
* Nhóm 3: (400+480)/2 = 440
* Nhóm 4: (480+560)/2 = 520
* Nhóm 5: (560+640)/2 = 600
* Nhóm 6: (640+720)/2 = 680
* Nhóm 7: (720+800)/2 = 760
3. Tính trung bình mẫu (x̄) và độ lệch chuẩn mẫu (s):
* Tổng số người (n) = 8 + 12 + 20 + 25 + 20 + 10 + 5 = 100
* Tính tổng của (điểm giữa * số người) để tìm tổng thu nhập:
(280 * 8) + (360 * 12) + (440 * 20) + (520 * 25) + (600 * 20) + (680 * 10) + (760 * 5)
= 2240 + 4320 + 8800 + 13000 + 12000 + 6800 + 3800 = 50960
* Trung bình mẫu: x̄ = 50960 / 100 = 509.6 (triệu đồng/năm)
* Tính phương sai mẫu (s²). Ta cần tính tổng của (điểm giữa - x̄)² * số người.
(280-509.6)²*8 + (360-509.6)²*12 + (440-509.6)²*20 + (520-509.6)²*25 + (600-509.6)²*20 + (680-509.6)²*10 + (760-509.6)²*5
= 120969.6*8 + 22177.6*12 + 3873.6*20 + 104.04*25 + 8172.96*20 + 29025.04*10 + 63532.96*5
= 967756.8 + 266131.2 + 77472 + 2601 + 163459.2 + 290250.4 + 317664.8 = 2085335.4
* Phương sai mẫu hiệu chỉnh: s² = 2085335.4 / (100 - 1) ≈ 21063.99
* Độ lệch chuẩn mẫu: s = √21063.99 ≈ 145.13
4. Xác định cận dưới của khoảng tin cậy:
* Mức ý nghĩa α = 1 - 0.95 = 0.05.
* Vì cỡ mẫu n=100 > 30, ta có thể sử dụng phân phối chuẩn Z hoặc phân phối t với độ tự do df = n-1 = 99. Với cỡ mẫu lớn, Z và t gần như tương đương. Thông thường, khi không cho biết độ lệch chuẩn tổng thể, ta dùng Z và độ lệch chuẩn mẫu.
* Giá trị tới hạn Z(α/2) = Z(0.025). Từ bảng phân phối Z, Z(0.025) ≈ 1.96.
* Sai số biên (Margin of Error - MOE) = Z(α/2) * (s / √n) = 1.96 * (145.13 / √100) = 1.96 * 14.513 ≈ 28.45
* Khoảng tin cậy cho trung bình tổng thể μ là: x̄ ± MOE.
* Khoảng tin cậy (95%) = 509.6 ± 28.45
* Cận dưới = 509.6 - 28.45 = 481.15
* Cận trên = 509.6 + 28.45 = 538.05
* Câu hỏi hỏi "không thấp hơn bao nhiêu", tức là cận dưới của khoảng tin cậy. Do đó, với độ tin cậy 95%, thu nhập trung bình của nhân viên ngân hàng A không thấp hơn 481.15 triệu đồng/năm.
Phần b) Kiểm định giả thuyết về tỷ lệ nhân viên thu nhập cao:
1. Xác định bài toán: Đây là bài toán kiểm định giả thuyết về một tỷ lệ.
2. Thông tin đã cho:
* Thu nhập cao: từ 640 triệu đồng/năm trở lên.
* Tỷ lệ nhân viên thu nhập cao năm 2019 (tỷ lệ cũ, p0) = 12.5% = 0.125.
* Mức ý nghĩa (α) = 5% = 0.05.
* Dữ liệu năm 2020: Số người có thu nhập từ 640 trở lên là số người thuộc nhóm "640 - 720" và "720 - 800". Tuy nhiên, đề bài cho khoảng thu nhập, không cho số lượng cụ thể trong từng nhóm đó. Để tính tỷ lệ năm nay, ta cần biết số người trong các nhóm "640 - 720" (10 người) và "720 - 800" (5 người). Tổng số người thu nhập cao = 10 + 5 = 15 người.
* Tổng số người khảo sát = 100 người.
* Tỷ lệ nhân viên thu nhập cao năm nay (p̂) = 15 / 100 = 0.15.
3. Thiết lập giả thuyết:
* Giả thuyết không (H0): Tỷ lệ nhân viên thu nhập cao năm nay không cao hơn năm trước (p ≤ p0).
* Giả thuyết đối (H1): Tỷ lệ nhân viên thu nhập cao năm nay cao hơn năm trước (p > p0).
* Đây là kiểm định một phía (bên phải).
4. Kiểm tra điều kiện áp dụng kiểm định Z cho tỷ lệ:
* n * p0 = 100 * 0.125 = 12.5 ≥ 5
* n * (1 - p0) = 100 * (1 - 0.125) = 100 * 0.875 = 87.5 ≥ 5
* Điều kiện được thỏa mãn.
5. Tính thống kê kiểm định Z:
* Z = (p̂ - p0) / √[p0 * (1 - p0) / n]
* Z = (0.15 - 0.125) / √[0.125 * (1 - 0.125) / 100]
* Z = 0.025 / √[0.125 * 0.875 / 100]
* Z = 0.025 / √[0.109375 / 100]
* Z = 0.025 / √0.00109375
* Z = 0.025 / 0.03307 ≈ 0.756
6. Xác định giá trị tới hạn hoặc p-value:
* Với mức ý nghĩa α = 0.05 và kiểm định một phía bên phải, giá trị tới hạn Z(α) = Z(0.05). Từ bảng phân phối Z, Z(0.05) ≈ 1.645.
* So sánh Z tính toán với giá trị tới hạn: 0.756 < 1.645.
* Do Z tính toán nhỏ hơn Z tới hạn, ta không bác bỏ giả thuyết không H0.
7. Kết luận:
* Với mức ý nghĩa 5%, không có đủ bằng chứng thống kê để kết luận rằng tỷ lệ nhân viên thu nhập cao năm nay cao hơn năm 2019.
Lưu ý: Dữ liệu về thu nhập trong bảng được cho dưới dạng khoảng. Việc tính toán trung bình mẫu và độ lệch chuẩn mẫu dựa trên điểm giữa của các khoảng là phương pháp tiêu chuẩn cho dữ liệu nhóm. Độ tin cậy 95% và mức ý nghĩa 5% là các giá trị phổ biến trong thống kê.
Phần a) Ước lượng khoảng tin cậy cho thu nhập trung bình:
1. Xác định bài toán: Đây là bài toán ước lượng khoảng cho trung bình tổng thể khi biết độ lệch chuẩn tổng thể hoặc khi cỡ mẫu đủ lớn (áp dụng theo định lý giới hạn trung tâm). Tuy nhiên, đề bài không cho sẵn độ lệch chuẩn tổng thể. Trong trường hợp này, ta có thể ước lượng độ lệch chuẩn tổng thể từ mẫu hoặc sử dụng phân phối t-Student nếu cỡ mẫu không quá lớn. Nhưng thông thường, với các bài tập dạng này, nếu không cho độ lệch chuẩn tổng thể, ta sẽ tính độ lệch chuẩn mẫu để ước lượng.
2. Xử lý dữ liệu nhóm: Bảng số liệu cung cấp dữ liệu thu nhập theo nhóm. Để tính toán các tham số thống kê như trung bình mẫu và độ lệch chuẩn mẫu, ta cần xác định điểm giữa của mỗi nhóm.
* Nhóm 1: (240+320)/2 = 280
* Nhóm 2: (320+400)/2 = 360
* Nhóm 3: (400+480)/2 = 440
* Nhóm 4: (480+560)/2 = 520
* Nhóm 5: (560+640)/2 = 600
* Nhóm 6: (640+720)/2 = 680
* Nhóm 7: (720+800)/2 = 760
3. Tính trung bình mẫu (x̄) và độ lệch chuẩn mẫu (s):
* Tổng số người (n) = 8 + 12 + 20 + 25 + 20 + 10 + 5 = 100
* Tính tổng của (điểm giữa * số người) để tìm tổng thu nhập:
(280 * 8) + (360 * 12) + (440 * 20) + (520 * 25) + (600 * 20) + (680 * 10) + (760 * 5)
= 2240 + 4320 + 8800 + 13000 + 12000 + 6800 + 3800 = 50960
* Trung bình mẫu: x̄ = 50960 / 100 = 509.6 (triệu đồng/năm)
* Tính phương sai mẫu (s²). Ta cần tính tổng của (điểm giữa - x̄)² * số người.
(280-509.6)²*8 + (360-509.6)²*12 + (440-509.6)²*20 + (520-509.6)²*25 + (600-509.6)²*20 + (680-509.6)²*10 + (760-509.6)²*5
= 120969.6*8 + 22177.6*12 + 3873.6*20 + 104.04*25 + 8172.96*20 + 29025.04*10 + 63532.96*5
= 967756.8 + 266131.2 + 77472 + 2601 + 163459.2 + 290250.4 + 317664.8 = 2085335.4
* Phương sai mẫu hiệu chỉnh: s² = 2085335.4 / (100 - 1) ≈ 21063.99
* Độ lệch chuẩn mẫu: s = √21063.99 ≈ 145.13
4. Xác định cận dưới của khoảng tin cậy:
* Mức ý nghĩa α = 1 - 0.95 = 0.05.
* Vì cỡ mẫu n=100 > 30, ta có thể sử dụng phân phối chuẩn Z hoặc phân phối t với độ tự do df = n-1 = 99. Với cỡ mẫu lớn, Z và t gần như tương đương. Thông thường, khi không cho biết độ lệch chuẩn tổng thể, ta dùng Z và độ lệch chuẩn mẫu.
* Giá trị tới hạn Z(α/2) = Z(0.025). Từ bảng phân phối Z, Z(0.025) ≈ 1.96.
* Sai số biên (Margin of Error - MOE) = Z(α/2) * (s / √n) = 1.96 * (145.13 / √100) = 1.96 * 14.513 ≈ 28.45
* Khoảng tin cậy cho trung bình tổng thể μ là: x̄ ± MOE.
* Khoảng tin cậy (95%) = 509.6 ± 28.45
* Cận dưới = 509.6 - 28.45 = 481.15
* Cận trên = 509.6 + 28.45 = 538.05
* Câu hỏi hỏi "không thấp hơn bao nhiêu", tức là cận dưới của khoảng tin cậy. Do đó, với độ tin cậy 95%, thu nhập trung bình của nhân viên ngân hàng A không thấp hơn 481.15 triệu đồng/năm.
Phần b) Kiểm định giả thuyết về tỷ lệ nhân viên thu nhập cao:
1. Xác định bài toán: Đây là bài toán kiểm định giả thuyết về một tỷ lệ.
2. Thông tin đã cho:
* Thu nhập cao: từ 640 triệu đồng/năm trở lên.
* Tỷ lệ nhân viên thu nhập cao năm 2019 (tỷ lệ cũ, p0) = 12.5% = 0.125.
* Mức ý nghĩa (α) = 5% = 0.05.
* Dữ liệu năm 2020: Số người có thu nhập từ 640 trở lên là số người thuộc nhóm "640 - 720" và "720 - 800". Tuy nhiên, đề bài cho khoảng thu nhập, không cho số lượng cụ thể trong từng nhóm đó. Để tính tỷ lệ năm nay, ta cần biết số người trong các nhóm "640 - 720" (10 người) và "720 - 800" (5 người). Tổng số người thu nhập cao = 10 + 5 = 15 người.
* Tổng số người khảo sát = 100 người.
* Tỷ lệ nhân viên thu nhập cao năm nay (p̂) = 15 / 100 = 0.15.
3. Thiết lập giả thuyết:
* Giả thuyết không (H0): Tỷ lệ nhân viên thu nhập cao năm nay không cao hơn năm trước (p ≤ p0).
* Giả thuyết đối (H1): Tỷ lệ nhân viên thu nhập cao năm nay cao hơn năm trước (p > p0).
* Đây là kiểm định một phía (bên phải).
4. Kiểm tra điều kiện áp dụng kiểm định Z cho tỷ lệ:
* n * p0 = 100 * 0.125 = 12.5 ≥ 5
* n * (1 - p0) = 100 * (1 - 0.125) = 100 * 0.875 = 87.5 ≥ 5
* Điều kiện được thỏa mãn.
5. Tính thống kê kiểm định Z:
* Z = (p̂ - p0) / √[p0 * (1 - p0) / n]
* Z = (0.15 - 0.125) / √[0.125 * (1 - 0.125) / 100]
* Z = 0.025 / √[0.125 * 0.875 / 100]
* Z = 0.025 / √[0.109375 / 100]
* Z = 0.025 / √0.00109375
* Z = 0.025 / 0.03307 ≈ 0.756
6. Xác định giá trị tới hạn hoặc p-value:
* Với mức ý nghĩa α = 0.05 và kiểm định một phía bên phải, giá trị tới hạn Z(α) = Z(0.05). Từ bảng phân phối Z, Z(0.05) ≈ 1.645.
* So sánh Z tính toán với giá trị tới hạn: 0.756 < 1.645.
* Do Z tính toán nhỏ hơn Z tới hạn, ta không bác bỏ giả thuyết không H0.
7. Kết luận:
* Với mức ý nghĩa 5%, không có đủ bằng chứng thống kê để kết luận rằng tỷ lệ nhân viên thu nhập cao năm nay cao hơn năm 2019.
Lưu ý: Dữ liệu về thu nhập trong bảng được cho dưới dạng khoảng. Việc tính toán trung bình mẫu và độ lệch chuẩn mẫu dựa trên điểm giữa của các khoảng là phương pháp tiêu chuẩn cho dữ liệu nhóm. Độ tin cậy 95% và mức ý nghĩa 5% là các giá trị phổ biến trong thống kê.
Lời giải:
Câu hỏi này thuộc lĩnh vực xác suất thống kê, cụ thể là bài toán về xác suất của các biến cố giao và hợp. Chúng ta có các thông tin sau:
- Gọi A là biến cố khách hàng đầu tư vào trái phiếu miễn thuế.
- Gọi B là biến cố khách hàng đầu tư vào chứng chỉ quỹ.
- Xác suất khách hàng đầu tư vào trái phiếu miễn thuế là P(A) = 0,6.
- Xác suất khách hàng đầu tư vào chứng chỉ quỹ là P(B) = 0,3.
- Xác suất khách hàng đầu tư vào cả hai loại trên là P(A ∩ B) = 0,15.
Chúng ta cần tìm xác suất để khách hàng không đầu tư vào trái phiếu miễn thuế (biến cố đối của A, ký hiệu là A') VÀ không đầu tư vào chứng chỉ quỹ (biến cố đối của B, ký hiệu là B'). Điều này tương đương với việc tìm xác suất của biến cố A' ∩ B'.
Theo quy tắc De Morgan trong lý thuyết xác suất, biến cố (A' ∩ B') tương đương với biến cố (A ∪ B)'.
Xác suất của biến cố (A ∪ B)' được tính bằng công thức: P((A ∪ B)') = 1 - P(A ∪ B).
Tiếp theo, chúng ta cần tính xác suất của biến cố hợp A ∪ B. Công thức tính xác suất của biến cố hợp là:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B).
Thay các giá trị đã cho vào công thức:
P(A ∪ B) = 0,6 + 0,3 - 0,15 = 0,9 - 0,15 = 0,75.
Bây giờ, chúng ta có thể tính xác suất của biến cố mà khách hàng không đầu tư vào trái phiếu miễn thuế cũng không đầu tư vào chứng chỉ quỹ:
P(A' ∩ B') = P((A ∪ B)') = 1 - P(A ∪ B) = 1 - 0,75 = 0,25.
Vậy, xác suất để tại thời điểm này một khách hàng không đầu tư vào trái phiếu miễn thuế cũng không đầu tư vào chứng chỉ quỹ là 0,25.
- Gọi A là biến cố khách hàng đầu tư vào trái phiếu miễn thuế.
- Gọi B là biến cố khách hàng đầu tư vào chứng chỉ quỹ.
- Xác suất khách hàng đầu tư vào trái phiếu miễn thuế là P(A) = 0,6.
- Xác suất khách hàng đầu tư vào chứng chỉ quỹ là P(B) = 0,3.
- Xác suất khách hàng đầu tư vào cả hai loại trên là P(A ∩ B) = 0,15.
Chúng ta cần tìm xác suất để khách hàng không đầu tư vào trái phiếu miễn thuế (biến cố đối của A, ký hiệu là A') VÀ không đầu tư vào chứng chỉ quỹ (biến cố đối của B, ký hiệu là B'). Điều này tương đương với việc tìm xác suất của biến cố A' ∩ B'.
Theo quy tắc De Morgan trong lý thuyết xác suất, biến cố (A' ∩ B') tương đương với biến cố (A ∪ B)'.
Xác suất của biến cố (A ∪ B)' được tính bằng công thức: P((A ∪ B)') = 1 - P(A ∪ B).
Tiếp theo, chúng ta cần tính xác suất của biến cố hợp A ∪ B. Công thức tính xác suất của biến cố hợp là:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B).
Thay các giá trị đã cho vào công thức:
P(A ∪ B) = 0,6 + 0,3 - 0,15 = 0,9 - 0,15 = 0,75.
Bây giờ, chúng ta có thể tính xác suất của biến cố mà khách hàng không đầu tư vào trái phiếu miễn thuế cũng không đầu tư vào chứng chỉ quỹ:
P(A' ∩ B') = P((A ∪ B)') = 1 - P(A ∪ B) = 1 - 0,75 = 0,25.
Vậy, xác suất để tại thời điểm này một khách hàng không đầu tư vào trái phiếu miễn thuế cũng không đầu tư vào chứng chỉ quỹ là 0,25.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy
89 tài liệu310 lượt tải

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin
125 tài liệu441 lượt tải

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông
104 tài liệu687 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán
103 tài liệu589 lượt tải

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp
377 tài liệu1030 lượt tải

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
99 tài liệu1062 lượt tải
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.
77.000 đ/ tháng