JavaScript is required
Danh sách đề

120+ câu hỏi trắc nghiệm Lý thuyết môn Học máy kèm đáp án chi tiết - Đề 1

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50
L1.X. Cách tiếp cận nào sau đây giúp tránh việc trang bị thiếu trang bị?
A.
Thực hiện kỹ thuật tính năng 
B.
Thực hiện tiền xử lý dữ liệu a cách khéo léo 
C.
Tăng độ phức tạp của mô hình 
D.
Tất cả các phương pháp được đề cập
Đáp án
Câu hỏi liên quan đến việc tránh tình trạng "trang bị thiếu" (underfitting) trong mô hình học máy. Dưới đây là phân tích chi tiết: * **a. Thực hiện kỹ thuật tính năng:** Việc lựa chọn, biến đổi, hoặc tạo ra các tính năng (features) phù hợp có thể giúp mô hình nắm bắt được các mối quan hệ quan trọng trong dữ liệu. Nếu các tính năng không đủ để mô tả dữ liệu một cách chính xác, mô hình sẽ bị underfitting. Do đó, kỹ thuật tính năng là một phương pháp quan trọng để giải quyết vấn đề này. * **b. Thực hiện tiền xử lý dữ liệu một cách khéo léo:** Tiền xử lý dữ liệu (data preprocessing) bao gồm các bước như làm sạch dữ liệu, xử lý giá trị thiếu, chuẩn hóa dữ liệu, và mã hóa dữ liệu. Nếu tiền xử lý không tốt, dữ liệu có thể bị mất thông tin quan trọng, dẫn đến underfitting. Tiền xử lý khéo léo giúp đảm bảo dữ liệu chất lượng và phù hợp cho mô hình học. * **c. Tăng độ phức tạp của mô hình:** Một mô hình quá đơn giản có thể không đủ khả năng để nắm bắt các mối quan hệ phức tạp trong dữ liệu, dẫn đến underfitting. Việc tăng độ phức tạp của mô hình (ví dụ: sử dụng mạng nơ-ron sâu hơn, thêm các tham số) có thể giúp mô hình học được các mẫu phức tạp hơn và giảm thiểu underfitting. Vì cả ba phương pháp trên đều có thể giúp tránh việc trang bị thiếu, đáp án đúng là: * **d. Tất cả các phương pháp được đề cập**

Danh sách câu hỏi:

Câu 1:

L1.X. Cách tiếp cận nào sau đây giúp tránh việc trang bị thiếu trang bị?
Lời giải:
Đáp án đúng: D
Câu hỏi liên quan đến việc tránh tình trạng "trang bị thiếu" (underfitting) trong mô hình học máy. Dưới đây là phân tích chi tiết: * **a. Thực hiện kỹ thuật tính năng:** Việc lựa chọn, biến đổi, hoặc tạo ra các tính năng (features) phù hợp có thể giúp mô hình nắm bắt được các mối quan hệ quan trọng trong dữ liệu. Nếu các tính năng không đủ để mô tả dữ liệu một cách chính xác, mô hình sẽ bị underfitting. Do đó, kỹ thuật tính năng là một phương pháp quan trọng để giải quyết vấn đề này. * **b. Thực hiện tiền xử lý dữ liệu một cách khéo léo:** Tiền xử lý dữ liệu (data preprocessing) bao gồm các bước như làm sạch dữ liệu, xử lý giá trị thiếu, chuẩn hóa dữ liệu, và mã hóa dữ liệu. Nếu tiền xử lý không tốt, dữ liệu có thể bị mất thông tin quan trọng, dẫn đến underfitting. Tiền xử lý khéo léo giúp đảm bảo dữ liệu chất lượng và phù hợp cho mô hình học. * **c. Tăng độ phức tạp của mô hình:** Một mô hình quá đơn giản có thể không đủ khả năng để nắm bắt các mối quan hệ phức tạp trong dữ liệu, dẫn đến underfitting. Việc tăng độ phức tạp của mô hình (ví dụ: sử dụng mạng nơ-ron sâu hơn, thêm các tham số) có thể giúp mô hình học được các mẫu phức tạp hơn và giảm thiểu underfitting. Vì cả ba phương pháp trên đều có thể giúp tránh việc trang bị thiếu, đáp án đúng là: * **d. Tất cả các phương pháp được đề cập**
Lời giải:
Đáp án đúng: A
Thiên kiến (Bias) trong học máy xảy ra khi mô hình quá đơn giản và không thể nắm bắt được sự phức tạp của dữ liệu. Điều này dẫn đến việc mô hình đưa ra những dự đoán sai lệch một cách hệ thống, gây ra sự khác biệt lớn giữa giá trị dự đoán và giá trị thực tế. Phương sai (Variance) lại liên quan đến việc mô hình quá nhạy cảm với những biến động nhỏ trong dữ liệu huấn luyện, dẫn đến việc hoạt động kém trên dữ liệu mới. Tín hiệu (Signal) là thông tin có giá trị trong dữ liệu, còn tiếng ồn (Noise) là những yếu tố ngẫu nhiên không liên quan.

Câu 3:

L1.X. Quá trình giảm kích thước của tập tính năng được gọi là ... 
Lời giải:
Đáp án đúng: A
Quá trình giảm kích thước của tập tính năng (feature set) nhằm mục đích chọn ra những tính năng quan trọng nhất, loại bỏ các tính năng dư thừa hoặc không liên quan, giúp mô hình học nhanh hơn, hiệu quả hơn và tránh overfitting. Quá trình này thường được gọi là giảm kích thước (dimensionality reduction) hoặc lựa chọn đặc trưng (feature selection). Trong các lựa chọn được đưa ra, "Giảm kích thước" là đáp án phù hợp nhất.
Lời giải:
Đáp án đúng: C
Câu hỏi này liên quan đến việc xác định lĩnh vực nào tập trung vào việc tìm kiếm mối quan hệ giữa các đặc điểm mô tả và đặc điểm mục tiêu từ dữ liệu quan sát được. Ta xét từng đáp án: * **a. Phát hiện đối tượng:** Đây là một nhiệm vụ trong thị giác máy tính, liên quan đến việc xác định và định vị các đối tượng trong ảnh hoặc video. Nó không trực tiếp liên quan đến việc tìm kiếm mối quan hệ giữa các đặc điểm. * **b. Khai thác dữ liệu:** Đây là quá trình khám phá các mẫu và tri thức hữu ích từ lượng lớn dữ liệu. Việc tìm kiếm mối quan hệ giữa các đặc điểm là một phần quan trọng của khai thác dữ liệu. * **c. Học máy:** Đây là một lĩnh vực của trí tuệ nhân tạo, tập trung vào việc phát triển các thuật toán cho phép máy tính học từ dữ liệu mà không cần được lập trình rõ ràng. Việc tìm kiếm mối quan hệ giữa các đặc điểm là nền tảng của nhiều thuật toán học máy. * **d. Khoa học dữ liệu:** Đây là một lĩnh vực liên ngành sử dụng các phương pháp khoa học, thuật toán và hệ thống để trích xuất tri thức và hiểu biết sâu sắc từ dữ liệu. Nó bao gồm nhiều khía cạnh, bao gồm cả khai thác dữ liệu và học máy. Trong các lựa chọn trên, **học máy** là đáp án chính xác nhất vì nó trực tiếp liên quan đến việc xây dựng các mô hình dựa trên việc học các mối quan hệ từ dữ liệu. Khai thác dữ liệu và khoa học dữ liệu là các lĩnh vực rộng lớn hơn bao gồm nhiều hoạt động khác, trong khi phát hiện đối tượng là một nhiệm vụ cụ thể trong thị giác máy tính.
Lời giải:
Đáp án đúng: B
Câu hỏi này kiểm tra kiến thức về các tập dữ liệu khác nhau được sử dụng trong huấn luyện và đánh giá mô hình học máy. * **Tập huấn luyện (training set):** Là tập dữ liệu được sử dụng để huấn luyện mô hình học máy. Mô hình sẽ học các mẫu từ tập dữ liệu này để đưa ra dự đoán. * **Bộ xác nhận (validation set):** Được sử dụng để tinh chỉnh các siêu tham số (hyperparameter) của mô hình và đánh giá hiệu suất của mô hình trong quá trình huấn luyện. Mục đích là để ngăn chặn việc mô hình bị "quá khớp" (overfitting) với tập huấn luyện. * **Bộ thử nghiệm (test set):** Là tập dữ liệu độc lập được sử dụng để đánh giá hiệu suất cuối cùng của mô hình sau khi đã được huấn luyện và tinh chỉnh. Tập thử nghiệm phải độc lập với tập huấn luyện và tập xác nhận để đảm bảo đánh giá khách quan. * **Bộ nhớ đệm:** Đây không phải là thuật ngữ phổ biến trong ngữ cảnh này. Vì vậy, đáp án đúng là "b. bộ thử nghiệm" vì nó đáp ứng định nghĩa về một tập hợp các trường hợp dữ liệu độc lập, tuân theo phân phối xác suất tương tự như tập huấn luyện và được dùng để đánh giá mô hình sau cùng.

Câu 6:

Về cơ bản, thuật toán ML tìm kiếm mô hình "tốt nhất" thông qua a tập hợp các mô hình tiềm năng. Từ "tốt nhất" có nghĩa là... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 7:

Giai đoạn nào trong CRISP-DM mô hình học máy được vận hành như a phần của toàn bộ quy trình kinh doanh? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Phân loại là a ví dụ của ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Giai đoạn nào trong CRISP-DM xem xét các định dạng dữ liệu của nguồn dữ liệu trong a tổ chức? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Những loại bộ dữ liệu nào thường cần thiết để xây dựng mô hình học máy như a quy trình 'hoàn thành'? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 11:

Bộ xác thực là a phần của tập dữ liệu gốc, được xử lý trước, chủ yếu được sử dụng để ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Theo bài giảng, giả sử rằng chúng ta chỉ sử dụng một tính năng duy nhất để dự đoán giá nhà (ví dụ: giá = theta_0 + theta_1*kích thước), câu nào sau đây là chính xác? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Theo bài giảng, giá nhà được xác định như sau: Giá theta_0 + theta_1*kích thước. Thuật ngữ 'giá' được gọi là ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

L3. Số liệu nào sau đây thường KHÔNG được sử dụng để huấn luyện mô hình hồi quy tuyến tính? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 18:

L3. Giả sử mối quan hệ giữa các biến độc lập x1, x2 và biến phụ thuộc y như sau. y = x0 - 0,95x1 + 0,96x2. Điều nào sau đây là đúng? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

L3. Theo bài giảng, giá nhà được xác định như sau: giá = Theta_0 + Theta_1*size. Theta_0 và Theta_1 được gọi là ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 21:

Cơ sở lý luận của việc chọn hàm sigmoid trong mô hình hồi quy logistic? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 23:

Chọn phát biểu đúng về phương pháp One-Vs-All trong hồi quy logistic. 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 25:

Nếu chúng ta chỉ sử dụng 2 đặc điểm để huấn luyện mô hình hồi quy logistic thì dạng quyết định biên là ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

Hồi quy logistic chỉ có tác dụng đối với tập dữ liệu có mối quan hệ thực sự giữa x và y là tuyến tính vì ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Giả sử chúng ta có một đồng xu công bằng và muốn tìm ra tỷ lệ cơ hội để ra mặt ngửa. Lựa chọn nào sau đây đúng cho trường hợp này? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 31:

Nếu một mô hình học máy phù hợp tốt trên tập huấn luyện nhưng thực hiện kém trên tập kiểm tra, thì mô hình đó gặp vấn đề... Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Trong các nhiệm vụ sau đây, nhiệm vụ nào được coi là một vấn đề dự đoán? Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 35:

Nếu một mô hình học máy phù hợp với tập dữ liệu huấn luyện cũng phù hợp với tập dữ liệu kiểm tra, thì ... Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 36:

Phân loại là một ví dụ về ... Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Vấn đề gì có thể xảy ra khi huấn luyện một mô hình học máy bằng cách cung cấp dữ liệu quan sát? Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Các thành phần chính khi xây dựng một mô hình học máy là gì? Lựa chọn: 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 41:

Thuật toán phân loại có giám sát nào sau đây áp dụng cho hai lớp được gán nhãn -1 và +1? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Ma trận vuông A ER^(n×n) được gọi là chéo hóa khi tồn tại ma trận D và P, sao cho A=PDP-1, trong đó D và P phải đáp ứng điều kiện nào sau đây? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Phép phân loại nào sau đây sử dụng ý tưởng “Tìm đường phân chia sao cho lề của hai lớp là như nhau đối với đường phân chia đó"?
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 44:

Phát biểu nào sau đây là đúng đối với thuật toán K lân cận gần nhất? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Tập dữ liệu được sử dụng trực tiếp trong việc xây dựng mô hình học máy có tên gọi là gì? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Kỹ thuật nào sau đây có thể được dùng để thu giảm dữ liệu? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 47:

Thuật toán nào sau đây phù hợp nhất với yêu cầu "Hãy dự đoán tỉ giá ngoại tệ (là một số thực) dựa vào các dữ liệu về kinh tế vĩ mô được thu thập trong quá khứ"? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 48:

Nếu một mô hình học máy cho sai số trên trên tập huấn luyện thấp (training set) và sai số trên tập kiểm tra cao (testing set) thì khả năng mô hình đó ... 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Thuật toán nào sau đây được dùng để phân lớp? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Ma trận vuông A trong không gian R^(nxn) được gọi là chéo hóa được khi tồn tại ma trận D và P, sao cho A=PDP^(-1), trong đó D và P phải đáp ứng điều kiện nào sau đây? 
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP