JavaScript is required

Khi thực hiện câu lệnh sau:X_train. X_test, Y_train, Y_test = train_test_split(X.Y, test_size =0.2). Anh (chị) hãy cho biết tập dữ liệu dùng để training chiếm bao nhiêm % tập mẫu ban đầu

A.

90%

B.

95%

C.

80%

D.
20%
Trả lời:

Đáp án đúng: C


Câu lệnh `train_test_split(X, Y, test_size=0.2)` được sử dụng để chia tập dữ liệu `X` và `Y` thành tập huấn luyện (training set) và tập kiểm tra (test set). Tham số `test_size=0.2` chỉ định rằng 20% dữ liệu sẽ được sử dụng cho tập kiểm tra. Do đó, phần còn lại, tức là 80%, sẽ được sử dụng cho tập huấn luyện. Phương án A: 90% - Sai, vì tập test là 20% nên tập train phải là 80%. Phương án B: 95% - Sai, vì tập test là 20% nên tập train phải là 80%. Phương án C: 80% - Đúng, vì 100% - 20% = 80%. Phương án D: 20% - Sai, đây là kích thước của tập test, không phải tập train.

Câu hỏi liên quan