Một loại xét nghiệm nhanh có khả năng xác định dương tính Covid-19 chính xác 90% người nghi nhiễm, tỷ lệ xét nghiệm sai là 10%. Nếu chọn một người từ một nhóm người chỉ có 5% là thực sự dương tính, kết quả xét nghiệm bằng loại này kết luận anh ta dương tính. Tìm xác suất người đó không thực sự dương tính.
Trả lời:
Đáp án đúng:
Câu hỏi này thuộc lĩnh vực xác suất thống kê, cụ thể là áp dụng Định lý Bayes để tính xác suất có điều kiện. Chúng ta cần tìm xác suất một người không thực sự dương tính (âm tính giả) biết rằng kết quả xét nghiệm cho thấy anh ta dương tính.
Để giải quyết bài toán này, ta cần định nghĩa các biến cố sau:
- D: Biến cố người đó thực sự dương tính với Covid-19.
- D': Biến cố người đó không thực sự dương tính với Covid-19 (âm tính thật).
- T: Biến cố kết quả xét nghiệm cho ra dương tính.
- T': Biến cố kết quả xét nghiệm cho ra âm tính.
Theo đề bài, ta có các thông tin sau:
- Xác suất một người thực sự dương tính (tỷ lệ người nhiễm trong nhóm): P(D) = 5% = 0.05.
- Do đó, xác suất một người không thực sự dương tính: P(D') = 1 - P(D) = 1 - 0.05 = 0.95.
- Độ chính xác của xét nghiệm khi người đó dương tính (xác suất xét nghiệm cho kết quả dương tính khi thực sự dương tính - độ nhạy): P(T|D) = 90% = 0.90.
- Tỷ lệ xét nghiệm sai khi người đó dương tính (xác suất xét nghiệm cho kết quả âm tính khi thực sự dương tính - độ đặc hiệu, hoặc sai sót âm tính): P(T'|D) = 1 - P(T|D) = 1 - 0.90 = 0.10. Tuy nhiên, đề bài cho biết tỷ lệ xét nghiệm sai là 10% khi dương tính, điều này có thể hiểu là P(T'|D) = 0.10 hoặc P(T|D') = 0.10. Cần làm rõ ý nghĩa "tỷ lệ xét nghiệm sai là 10%". Nếu hiểu là sai khi dương tính, tức là âm tính giả, thì P(T'|D) = 0.10. Nếu hiểu là sai nói chung (dương tính giả hoặc âm tính giả), thì không đủ thông tin.
Tuy nhiên, với cách diễn đạt "có khả năng xác định dương tính Covid-19 chính xác 90% người nghi nhiễm, tỷ lệ xét nghiệm sai là 10%", thường hiểu rằng:
- Độ nhạy (Sensitivity): P(T|D) = 0.90 (Xét nghiệm dương tính khi thực sự dương tính).
- Tỷ lệ sai số (Error rate): Nếu không rõ là sai loại nào, ta cần suy luận. Một cách hiểu phổ biến là "tỷ lệ xét nghiệm sai" đề cập đến sai sót của xét nghiệm, có thể là dương tính giả hoặc âm tính giả. Tuy nhiên, nếu "chính xác 90% người nghi nhiễm" đã đề cập đến P(T|D), thì "tỷ lệ xét nghiệm sai là 10%" có thể ám chỉ P(T|D') (xác suất xét nghiệm dương tính khi thực sự âm tính - dương tính giả) hoặc P(T'|D) (xác suất xét nghiệm âm tính khi thực sự dương tính - âm tính giả).
Giả sử "tỷ lệ xét nghiệm sai là 10%" có nghĩa là xác suất xét nghiệm cho ra kết quả KHÔNG ĐÚNG với thực tế. Nếu "chính xác 90% người nghi nhiễm" là P(T|D)=0.90, thì tỷ lệ sai sót trong trường hợp này là P(T'|D) = 0.10. Điều này hợp lý vì P(T|D) + P(T'|D) = 1.
Trong bài toán này, chúng ta cần tìm P(D'|T): xác suất người đó không thực sự dương tính (âm tính thật) biết rằng kết quả xét nghiệm là dương tính.
Theo Định lý Bayes: P(D'|T) = [P(T|D') * P(D')] / P(T)
Chúng ta cần tính P(T|D') và P(T).
- P(T|D'): Đây là xác suất xét nghiệm cho ra dương tính khi người đó thực sự âm tính (dương tính giả). Đề bài nói "tỷ lệ xét nghiệm sai là 10%". Nếu hiểu "tỷ lệ xét nghiệm sai" là tỷ lệ dương tính giả, thì P(T|D') = 0.10.
- P(T): Xác suất xét nghiệm cho kết quả dương tính, ta tính bằng công thức xác suất toàn phần:
P(T) = P(T|D) * P(D) + P(T|D') * P(D')
Thay số vào:
P(T) = (0.90 * 0.05) + (0.10 * 0.95)
P(T) = 0.045 + 0.095
P(T) = 0.14
Bây giờ, thay các giá trị vào công thức Bayes để tính P(D'|T):
P(D'|T) = [P(T|D') * P(D')] / P(T)
P(D'|T) = (0.10 * 0.95) / 0.14
P(D'|T) = 0.095 / 0.14
P(D'|T) = 95 / 140
P(D'|T) = 19 / 28
P(D'|T) ≈ 0.67857
Như vậy, xác suất người đó không thực sự dương tính, biết rằng kết quả xét nghiệm dương tính, là khoảng 67.86%.
**Lưu ý quan trọng về diễn đạt đề bài:**
Cách diễn đạt "xác định dương tính Covid-19 chính xác 90% người nghi nhiễm, tỷ lệ xét nghiệm sai là 10%" có thể gây nhầm lẫn.
Nếu "chính xác 90% người nghi nhiễm" ám chỉ P(T|D) = 0.90, thì "tỷ lệ xét nghiệm sai là 10%" có thể hiểu là:
1. P(T'|D) = 0.10 (sai sót âm tính - âm tính giả).
2. P(T|D') = 0.10 (sai sót dương tính - dương tính giả).
Phần lớn các bài toán tương tự sẽ diễn đạt rõ hơn, ví dụ:
- Độ nhạy là 90% (P(T|D) = 0.90).
- Độ đặc hiệu là X% (P(T'|D') = X%).
Hoặc:
- Xác suất dương tính giả là Y% (P(T|D') = Y%).
- Xác suất âm tính giả là Z% (P(T'|D) = Z%).
Trong trường hợp này, nếu "chính xác 90% người nghi nhiễm" là P(T|D) = 0.90, thì "tỷ lệ xét nghiệm sai là 10%" khó có thể là P(T'|D) = 0.10 vì nó đã được suy ra từ P(T|D). Khả năng cao hơn là nó ám chỉ P(T|D') = 0.10 (tỷ lệ dương tính giả).
**Kiểm tra lại cách hiểu:**
- P(D) = 0.05 (tỷ lệ thực sự dương tính)
- P(D') = 0.95 (tỷ lệ thực sự âm tính)
- P(T|D) = 0.90 (độ nhạy: xét nghiệm dương khi thực sự dương)
- P(T|D') = 0.10 (tỷ lệ dương tính giả: xét nghiệm dương khi thực sự âm)
Chúng ta cần tìm P(D'|T), tức là xác suất thực sự âm tính khi xét nghiệm dương tính.
Theo Bayes:
P(D'|T) = P(T|D') * P(D') / P(T)
P(T) = P(T|D) * P(D) + P(T|D') * P(D')
P(T) = 0.90 * 0.05 + 0.10 * 0.95
P(T) = 0.045 + 0.095 = 0.14
P(D'|T) = (0.10 * 0.95) / 0.14
P(D'|T) = 0.095 / 0.14
P(D'|T) = 95 / 140 = 19 / 28
Kết quả này cho thấy, dù xét nghiệm dương tính, vẫn có tới 19/28 (khoảng 67.86%) khả năng người đó không thực sự dương tính. Điều này nhấn mạnh tầm quan trọng của tỷ lệ dương tính giả và tỷ lệ người thực sự dương tính trong quần thể khi diễn giải kết quả xét nghiệm.
**Diễn đạt lại câu hỏi cho rõ ràng hơn:**
Một loại xét nghiệm nhanh có độ nhạy là 90% (khả năng phát hiện đúng người dương tính) và tỷ lệ dương tính giả là 10% (khả năng báo dương tính với người âm tính). Nếu chọn một người từ một nhóm dân cư mà 5% trong số đó thực sự dương tính với Covid-19, và người này có kết quả xét nghiệm dương tính. Tìm xác suất để người đó thực sự không dương tính (tức là kết quả xét nghiệm là dương tính giả).
Đề thi kết thúc học phần môn Toán kinh tế 2 (MAT11A) của Học viện Ngân hàng. Đề thi bao gồm các bài tập về xác suất, thống kê, phân phối chuẩn, ước lượng khoảng, và kiểm định giả thuyết.
5 câu hỏi 90 phút