JavaScript is required
Danh sách đề

100+ câu hỏi trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh có đáp án giải thích dễ hiểu - Phần 1

50 câu hỏi 60 phút

Thẻ ghi nhớ
Luyện tập
Thi thử
Nhấn để lật thẻ
1 / 50

Chọn phát biểu sai:

A.

Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng cao

B.

AI sử dụng kết quả từ khoa học dữ liệu để có thể thông minh hơn, chính xác hơn

C.

Bigdata là công nghệ lưu trữ và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), yêu cầu tốc độ cao (velocity) và có tính xác thực (Veracity)

D.

Data mining là một phương pháp phân tích dữ liệu của khoa học dữ liệu

Đáp án
Phát biểu sai là c. Big Data không chỉ đơn thuần là công nghệ lưu trữ và khai thác dữ liệu. Nó là một khái niệm bao trùm, mô tả các tập dữ liệu cực lớn và phức tạp mà các công cụ xử lý dữ liệu truyền thống không thể quản lý được. Các đặc trưng chính của Big Data thường được mô tả bằng 5V: Volume (khối lượng), Variety (đa dạng), Velocity (tốc độ), Veracity (tính xác thực) và Value (giá trị). Phát biểu c thiếu yếu tố Value (giá trị). Các phương án còn lại đều đúng. Internet vạn vật (IoT) tạo ra lượng dữ liệu khổng lồ. AI sử dụng dữ liệu và kết quả phân tích để cải thiện. Data mining là một phần của khoa học dữ liệu.

Danh sách câu hỏi:

Câu 1:

Chọn phát biểu sai:

Lời giải:
Đáp án đúng: C
Phát biểu sai là c. Big Data không chỉ đơn thuần là công nghệ lưu trữ và khai thác dữ liệu. Nó là một khái niệm bao trùm, mô tả các tập dữ liệu cực lớn và phức tạp mà các công cụ xử lý dữ liệu truyền thống không thể quản lý được. Các đặc trưng chính của Big Data thường được mô tả bằng 5V: Volume (khối lượng), Variety (đa dạng), Velocity (tốc độ), Veracity (tính xác thực) và Value (giá trị). Phát biểu c thiếu yếu tố Value (giá trị). Các phương án còn lại đều đúng. Internet vạn vật (IoT) tạo ra lượng dữ liệu khổng lồ. AI sử dụng dữ liệu và kết quả phân tích để cải thiện. Data mining là một phần của khoa học dữ liệu.

Câu 2:

Kết quả mà khoa học dữ liệu hướng đến là: thông tin và tri thức

Lời giải:
Đáp án đúng: C
Khoa học dữ liệu (Data Science) không chỉ dừng lại ở việc thu thập và xử lý dữ liệu thô (dữ liệu). Mục tiêu cao nhất của nó là trích xuất thông tin có ý nghĩa từ dữ liệu, sau đó sử dụng thông tin này để tạo ra tri thức (knowledge) hoặc hiểu biết sâu sắc hơn về một vấn đề hoặc lĩnh vực cụ thể. Vì vậy, kết quả mà khoa học dữ liệu hướng đến bao gồm cả dữ liệu (ở mức độ xử lý và sử dụng), thông tin và tri thức. Do đó, đáp án 'd. Tất cả đều đúng' là đáp án chính xác nhất vì nó bao hàm tất cả các kết quả mà khoa học dữ liệu hướng tới.
Lời giải:
Đáp án đúng: D
PivotTable là công cụ mạnh mẽ để tóm tắt và phân tích dữ liệu hai chiều (hoặc nhiều chiều) bằng cách sắp xếp, lọc, nhóm và tính toán dữ liệu. Subtotal chỉ tính tổng phụ theo một chiều, Consolidate dùng để tổng hợp dữ liệu từ nhiều nguồn khác nhau. Do đó, PivotTable là lựa chọn phù hợp nhất trong trường hợp này.
Lời giải:
Đáp án đúng: D

Phân tích:

Câu hỏi này kiểm tra kiến thức về các công cụ và chức năng trong phần mềm bảng tính (như Microsoft Excel) được sử dụng để tổng hợp và hợp nhất dữ liệu từ nhiều nguồn khác nhau.

Giải thích các phương án:

  • a. Subtotal: Được sử dụng để tính tổng phụ trong một danh sách dữ liệu dựa trên các nhóm. Nó không hợp nhất dữ liệu từ nhiều bảng khác nhau.
  • b. Consolidate: Đây là chức năng được thiết kế đặc biệt để hợp nhất dữ liệu từ nhiều bảng hoặc vùng dữ liệu khác nhau, ngay cả khi chúng không có cùng cấu trúc. Nó cho phép bạn tổng hợp dữ liệu dựa trên các nhãn hàng và cột tương ứng.
  • c. PivotTable: Là một công cụ mạnh mẽ để tóm tắt và phân tích dữ liệu, nhưng nó thường được sử dụng để phân tích một bảng dữ liệu lớn, chứ không phải hợp nhất từ nhiều bảng không cùng cấu trúc.
  • d. Tự làm bằng tay: Mặc dù có thể thực hiện được, nhưng phương pháp này tốn thời gian, dễ xảy ra lỗi và không hiệu quả khi làm việc với lượng lớn dữ liệu.

Kết luận:

Do đó, phương án phù hợp nhất để hợp nhất dữ liệu từ nhiều bảng không cùng cấu trúc là Consolidate.

Câu 5:

Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây:

Lời giải:
Đáp án đúng: A
Chỉ số EMA (Exponential Moving Average) được tính bằng phương pháp san bằng mũ (Exponential Smoothing). Phương pháp này gán trọng số lớn hơn cho các dữ liệu gần đây nhất, làm cho EMA phản ứng nhanh hơn với những thay đổi giá mới so với SMA (Simple Moving Average).
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 8:

Tiền xử lý dữ liệu không bao gồm các bước nào sau đây:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 9:

Khi nào thì ta cần rời rạc hóa dữ liệu:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 10:

Phân lớp dữ liệu là thuộc phương pháp:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 14:

Giá trị a[i;j] trong ma trận nhầm lẫn (confusion matrix) cho biết:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 15:

Phương pháp chọn mẫu dữ liệu nào sau đây dùng để khắc phục tinh trạng over-fitting:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 16:

Một phương pháp phân cụm tốt là phương pháp cho kết quả phân cụm mà trong đó:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 17:

Trong Orange, đối với thuật toán phân cụm phân cấp (HAC) để có được kết quả phân cụm với số lượng cụm cụ thể ta cần làm gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 20:

Giá trị tại phần tử (i;j) trong ma trận nhầm lẫn cho biết:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 26:

Thuật toán nào sau đây cho phép xử lý trên nhiều kiểu dữ liệu khác nhau:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 28:

Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 29:

Chọn phát biểu sai

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 30:

Chọn phát biểu sai:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 33:

Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 37:

Tiền xử lý dữ liệu không bao gồm các bước nào sau đây?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 38:

Khi nào thì ta cần rời rạc hóa dữ liệu?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 42:

Giá trị a[i;j] trong ma trận nhầm lẫn (confusion matrix) cho biết:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 43:

Phương pháp chọn mẫu dữ liệu nào sau đây dùng để khắc phục tình trạng over-fitting?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 45:

Phân cụm dữ liệu là thuộc phương pháp:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 46:

Một phương pháp phân cụm tốt là phương pháp cho kết quả phân cụm mà trong đó:

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP
Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 49:

Trong Orange, đối với thuật toán phân cụm phân cấp (HAC) để có được kết quả phân cụm với số lượng cụm cụ thể ta cần làm gì?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP

Câu 50:

Trong Orange, đối với thuật toán K-mean, tham số đầu vào nào sau đây dùng để kiểm soát trong trường hợp dữ liệu hội tụ chậm hoặc không hội tụ?

Lời giải:
Bạn cần đăng ký gói VIP để làm bài, xem đáp án và lời giải chi tiết không giới hạn. Nâng cấp VIP