Kỹ thuật nào thường được sử dụng để phát hiện cạnh trong ảnh?
Đáp án đúng: C
Kỹ thuật phát hiện cạnh Canny (Canny edge detection) là một thuật toán được sử dụng rộng rãi để phát hiện cạnh trong ảnh. Nó bao gồm các bước lọc nhiễu, tìm gradient cường độ, loại bỏ các điểm không phải cực đại, và ngưỡng hóa kép để xác định và kết nối các cạnh. Các kỹ thuật khác như biến đổi Fourier, cân bằng biểu đồ và làm mờ Gaussian có các ứng dụng khác trong xử lý ảnh, nhưng không phải là phương pháp chính để phát hiện cạnh.
Câu hỏi liên quan
Phân tích:
Câu hỏi này kiểm tra kiến thức về các thuật toán máy học thường được sử dụng trong phân loại hình ảnh.
Giải thích các lựa chọn:
- A. Phân cụm K-mean: Là một thuật toán học không giám sát, thường được sử dụng để nhóm các điểm dữ liệu thành các cụm dựa trên khoảng cách. Không phù hợp cho phân loại hình ảnh trực tiếp.
- B. Cây quyết định: Là một thuật toán học có giám sát, có thể được sử dụng cho phân loại, nhưng thường không hiệu quả bằng CNN cho các tác vụ phân loại hình ảnh phức tạp.
- C. Mạng thần kinh tích chập (CNN): Là một loại mạng thần kinh nhân tạo được thiết kế đặc biệt để xử lý dữ liệu có cấu trúc lưới, chẳng hạn như hình ảnh. CNN có các lớp tích chập có thể tự động học các đặc trưng quan trọng từ hình ảnh, giúp chúng rất hiệu quả cho các tác vụ phân loại hình ảnh.
- D. Máy vectơ hỗ trợ (SVM): Là một thuật toán học có giám sát, có thể được sử dụng cho phân loại. SVM có thể hiệu quả, nhưng thường đòi hỏi nhiều công sức hơn trong việc trích xuất đặc trưng so với CNN, đặc biệt đối với các hình ảnh phức tạp.
Kết luận:
Mạng thần kinh tích chập (CNN) là thuật toán được sử dụng phổ biến và hiệu quả nhất cho phân loại hình ảnh nhờ khả năng tự động học các đặc trưng từ dữ liệu hình ảnh.
Phép chiếu phối cảnh (Perspective projection) là kỹ thuật được sử dụng để chuyển đổi một cảnh 3D thành một hình ảnh 2D, tạo ra cảm giác về chiều sâu và khoảng cách giống như cách mắt người nhìn thế giới thực. Các đường thẳng song song trong không gian 3D sẽ hội tụ tại một điểm ở xa trong hình ảnh 2D. Các lựa chọn khác không liên quan trực tiếp đến việc chuyển đổi 3D sang 2D theo cách này:
- Phép biến đổi affine: Một loại phép biến đổi hình học bảo toàn tính song song và tỷ lệ khoảng cách, nhưng không nhất thiết phải tạo ra hiệu ứng phối cảnh.
- Góc Euler: Được sử dụng để biểu diễn hướng của một vật thể trong không gian 3D, chứ không phải là một phép chiếu.
- Đồng âm: Là một khái niệm trong ngôn ngữ học, không liên quan đến đồ họa máy tính.
Kỹ thuật nào được sử dụng để phát hiện và theo dõi các đối tượng trong một chuỗi khung hình?
Dòng quang (Optical Flow) là kỹ thuật được sử dụng để ước tính chuyển động của các đối tượng hoặc pixel trong một chuỗi các khung hình video hoặc hình ảnh. Nó phân tích sự thay đổi về độ sáng giữa các khung hình liên tiếp để xác định hướng và tốc độ của chuyển động.
So khớp mẫu (Template Matching) là một kỹ thuật tìm kiếm một mẫu nhỏ (template) trong một hình ảnh lớn hơn. Nó có thể được sử dụng để theo dõi các đối tượng, nhưng thường kém hiệu quả hơn dòng quang khi đối tượng thay đổi hình dạng hoặc hướng.
Phát hiện góc Harris (Harris Corner Detection) là một thuật toán để tìm các góc trong một hình ảnh. Các góc là các điểm đặc trưng có thể được sử dụng để theo dõi các đối tượng, nhưng nó không trực tiếp cung cấp thông tin về chuyển động.
Biến đổi tính năng bất biến tỷ lệ (SIFT) là một thuật toán để phát hiện và mô tả các đặc trưng cục bộ trong một hình ảnh. Nó có thể được sử dụng để theo dõi các đối tượng, nhưng thường phức tạp hơn và tốn kém tính toán hơn so với dòng quang.
Do đó, đáp án chính xác nhất là A. Dòng quang.
- Độ chính xác đo lường tỷ lệ các đối tượng được phát hiện chính xác so với tổng số đối tượng được phát hiện. Nó cho biết mức độ chính xác của mô hình trong việc xác định các đối tượng.
- Nhớ lại đo lường tỷ lệ các đối tượng được phát hiện chính xác so với tổng số đối tượng thực tế có trong tập dữ liệu. Nó cho biết khả năng của mô hình trong việc tìm ra tất cả các đối tượng.
- Điểm F là trung bình điều hòa của độ chính xác và độ nhớ lại, cung cấp một đánh giá cân bằng về hiệu suất của mô hình.
Do đó, đáp án đúng là "D. Tất cả những điều trên".
Lọc trung vị là một kỹ thuật xử lý ảnh phi tuyến tính được sử dụng để giảm nhiễu, đặc biệt là nhiễu "muối và tiêu" (salt and pepper noise). Lọc trung vị hoạt động bằng cách thay thế giá trị của mỗi pixel bằng giá trị trung vị của các pixel lân cận. Điều này giúp loại bỏ các giá trị nhiễu (các giá trị cực đoan) mà vẫn bảo toàn được các cạnh và chi tiết quan trọng trong ảnh.
Toán tử Sobel được sử dụng để phát hiện cạnh.
Cân bằng biểu đồ được sử dụng để cải thiện độ tương phản.
Bộ lọc Laplacian của Gaussian (LoG) được sử dụng để tìm các cạnh và góc cạnh trong ảnh.

Bộ Đồ Án Tốt Nghiệp Ngành Trí Tuệ Nhân Tạo Và Học Máy

Bộ 120+ Đồ Án Tốt Nghiệp Ngành Hệ Thống Thông Tin

Bộ Đồ Án Tốt Nghiệp Ngành Mạng Máy Tính Và Truyền Thông

Bộ Luận Văn Tốt Nghiệp Ngành Kiểm Toán

Bộ 370+ Luận Văn Tốt Nghiệp Ngành Kế Toán Doanh Nghiệp

Bộ Luận Văn Tốt Nghiệp Ngành Quản Trị Thương Hiệu
ĐĂNG KÝ GÓI THI VIP
- Truy cập hơn 100K đề thi thử và chính thức các năm
- 2M câu hỏi theo các mức độ: Nhận biết – Thông hiểu – Vận dụng
- Học nhanh với 10K Flashcard Tiếng Anh theo bộ sách và chủ đề
- Đầy đủ: Mầm non – Phổ thông (K12) – Đại học – Người đi làm
- Tải toàn bộ tài liệu trên TaiLieu.VN
- Loại bỏ quảng cáo để tăng khả năng tập trung ôn luyện
- Tặng 15 ngày khi đăng ký gói 3 tháng, 30 ngày với gói 6 tháng và 60 ngày với gói 12 tháng.