JavaScript is required

Vì sao chỉ cần phân phối tỷ lệ tích lũy là đủ để mô tả số liệu?

A.

Chứa thông tin chi tiết về số liệu

B.

Chứa thông tin về hình dạng phân phối

C.

Chứa đủ thống kê mô tả số liệu

D.

Chứa max, min và các điểm phân vị

Trả lời:

Đáp án đúng: A


Phân phối tích lũy (Cumulative Distribution Function - CDF) mô tả xác suất để một biến ngẫu nhiên có giá trị nhỏ hơn hoặc bằng một giá trị nhất định. Từ phân phối tích lũy, ta có thể suy ra nhiều thông tin quan trọng về dữ liệu: * **Max và min:** Điểm bắt đầu và kết thúc của CDF cho biết giá trị nhỏ nhất và lớn nhất của dữ liệu. * **Các điểm phân vị (Quantiles):** Ví dụ, trung vị (median) là giá trị mà tại đó CDF bằng 0.5. Các điểm phân vị khác như Q1 (25%), Q3 (75%) cũng có thể dễ dàng xác định từ CDF. * **Hình dạng phân phối:** Dựa vào độ dốc và hình dạng của CDF, ta có thể ước lượng được dạng phân phối (ví dụ: phân phối chuẩn, phân phối skewed, v.v.). Vì vậy, phân phối tích lũy chứa đầy đủ thông tin về max, min và các điểm phân vị, cũng như gợi ý về hình dạng phân phối của dữ liệu, nên nó đủ để mô tả số liệu. Các lựa chọn khác không hoàn toàn chính xác: * **A. Chứa thông tin chi tiết về số liệu:** CDF không chứa mọi chi tiết (ví dụ: giá trị chính xác của từng điểm dữ liệu). * **B. Chứa thông tin về hình dạng phân phối:** Chính xác, nhưng chưa đầy đủ bằng D vì không đề cập đến các thống kê cụ thể. * **C. Chứa đủ thống kê mô tả số liệu:** Chính xác, nhưng D làm rõ hơn các thống kê nào được chứa. Do đó, lựa chọn D là câu trả lời chính xác nhất.

Câu hỏi liên quan