Báo cáo Nghiên cứu khoa học - Nhận dạng vân mạch máu lòng bàn tay dựa vào đặc trưng hướng đường vân cục bộ và đặc trưng sift cải tiến

TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN KHOA CÔNG NGHỆ THÔNG TIN ----------------------- PHẠM THỊ QUỲNH - TRẦN LÊ HẢI BÌNH NHẬN DẠNG VÂN MẠCH MÁU LÒNG BÀN TAY DỰA VÀO ĐẶC TRƯNG HƯỚNG ĐƯỜNG VÂN CỤC BỘ VÀ ĐẶC TRƯNG SIFT CẢI TIẾN BÁO CÁO NGHIÊN CỨU KHOA HỌC LẦN 3 - 2021 TP. HỒ CHÍ MINH - 2021 TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN KHOA CÔNG NGHỆ THÔNG TIN  PHẠM THỊ QUỲNH - TRẦN LÊ HẢI BÌNH NHẬN DẠNG VÂN MẠCH MÁU LÒNG BÀN TAY DỰA VÀO ĐẶC TRƯNG HƯỚNG ĐƯỜNG VÂN CỤC BỘ VÀ ĐẶ

75 trang | Chia sẻ: huong20 | Ngày: 04/01/2022 | Lượt xem: 262 | Lượt tải: 0

Tóm tắt tài liệu Báo cáo Nghiên cứu khoa học - Nhận dạng vân mạch máu lòng bàn tay dựa vào đặc trưng hướng đường vân cục bộ và đặc trưng sift cải tiến, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

ẶC TRƯNG SIFT CẢI TIẾN BÁO CÁO NGHIÊN CỨU KHOA HỌC LẦN 3 - 2021 NGƯỜI HƯỚNG DẪN TS. VĂN THIÊN HOÀNG THS. VÕ ANH TIẾN TP. HỒ CHÍ MINH - 2021 LỜI CAM ĐOAN Tôi xin cam đoan báo cáo nghiên cứu khoa học với đề tài: “Nhận dạng vân mạch máu lòng bàn tay dựa vào đặc trưng hướng đường vân cục bộ và đặc trưng sift cải tiến” là công trình nghiên cứu của riêng chúng tôi. Các trích dẫn, tham khảo trong quá trình nghiên cứu đều được trích dẫn đầy đủ, ghi rõ nguồn gốc. Tôi xin chịu hoàn toàn trách nhiệm nếu có bất kỳ sao chép không hợp lệ, vi phạm quy chế đào tạo. Người thực hiện Phạm Thị Quỳnh – Trần Lê Hải Bình LỜI CẢM ƠN Lời đầu tiên em xin gửi lời cảm ơn đến Ban lãnh đạo, toàn thể quý Thầy, Cô giảng viên Trường Đại học Quốc tế Sài Gòn đã tận tạo điệu kiện và cơ hội để chúng em được tham dự một cuộc thi trí tuệ, chuyên nghiệp và sáng tạo. Em xin gửi lời cảm ơn sâu sắc đến thầy TS. Văn Thiên Hoàng và thầy ThS. Võ Anh tiến đã tận tình hướng dẫn, tạo mọi điều kiện thuận lợi và chỉ bảo chúng em trong suốt thời gian làm nghiên cứu khoa học. Tuy vậy, do thời gian có hạn, mặc dù đã cố gắng hết sức nhưng chắc rằng bài nghiên cứu khoa học không tránh khỏi sự thiếu sót. Chúng em rất mong nhận được sự thông cảm và chỉ bảo tận tình của quý Thầy Cô và các bạn. Trân trọng cảm ơn. Phạm Thị Quỳnh – Trần Lê Hải Bình MỤC LỤC DANH MỤC TỪ VIẾT TẮT .................................................................................. 7 DANH MỤC BẢNG ............................................................................................... 9 DANH MỤC HÌNH ẢNH ..................................................................................... 10 TÓM TẮT ......................................................................................................... 12 CHƯƠNG 1 TỔNG QUAN .................................................................................. 13 1.1 Giới thiệu chung ....................................................................................... 13 1.2 Hệ thống nhận dạng vân mạch máu lòng bàn tay ...................................... 17 1.3 Mục tiêu đề tài .......................................................................................... 26 1.4 Phương pháp nghiên cứu .......................................................................... 26 1.5 Đặc trưng và phạm vi nghiên cứu ............................................................. 27 1.6 Cấu trúc báo cáo ....................................................................................... 27 CHƯƠNG 2 CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN ......................... 29 2.1 Bộ lọc MFRAT ........................................................................................ 29 2.2 Các đặc trưng mẫu nhị phân cục bộ .......................................................... 30 2.3 Đặc trưng dẫn xuất cục bộ (Local derivative pattern - LDP) ..................... 35 2.4 Các đặc trưng cục bộ bất biến ................................................................... 36 CHƯƠNG 3 PHƯƠNG PHÁP ĐỀ XUẤT ............................................................ 62 3.1 Ý tưởng .................................................................................................... 62 3.2 Thuật toán ................................................................................................ 62 CHƯƠNG 4 KẾT QUẢ THỰC NGHIỆM ............................................................ 66 4.1 Cơ sở dữ liệu thực nghiệm ........................................................................ 66 4.2 Kết quả thực nghiệm ................................................................................ 66 CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN......................................... 69 5.1 Kết luận .................................................................................................... 69 5 5.2 Kiến nghị.................................................................................................. 69 TÀI LIỆU THAM KHẢO ..................................................................................... 70 6 DANH MỤC TỪ VIẾT TẮT TỪ NỘI DUNG DIỄN GIẢI NIR Near-infrared Ánh sáng hồng ngoại ATM Automated Teller Machine Máy rút tiền tự động DNA Deoxyribonucleic acid Phân tử mang thông tin di truyền PDA Personal Digital Assistant Thiết bị kỹ thuật số hỗ trợ cá nhân CCD Charge Coupled Device Cảm biến CCD ROI Region of interest Vùng quan tâm LDP Local derivative pattern Đặc trưng dẫn xuất cục bộ LBP Local binary pattern Mẫu nhị phân cục bộ MFRAT Modified Finite Radon Transform Biến đổi radon hữu hạn Đặc trưng biến đổi bất biến theo tỉ SIFT Scale-invariant feature transform lệ SURF Speeded up robust feature Đặc trưng cải thiện tốc độ Affine scale invariant feature Đặc trưng biến đổi bất biến theo tỉ ASIFT transform lệ affin Root Scale-invariant feature RootSIFT Bộ mô tả SIFT nâng cao transform Phương pháp phân tích thành PCA Principal component analysis phần chính Two-dimensional principal Phương pháp phân tích thành 2D-PCA component analysis phần chính 2 chiều Two-dimensional fisher Phân tích phân biệt hai chiều 2D-FDA discriminant analysis fisher 7 Enhanced centersymmetric local Mẫu nhị phân cục bộ đối xứng ECS-LBP binary pattern tâm cải tiến Enhanced centersymmetric local Mẫu nhị phân cục bộ đối xứng EL-SIFT binary pattern with SIFT tâm cải tiến với SIFT MLBP Multivariate Local binary pattern Mẫu nhị phân cục bộ đa biến ELBP Enhanced local binary pattern Mẫu nhị phân cục bộ nâng cao LBPV Local binary pattern variance Phương sai mẫu nhị phân cục bộ DoG Difference-of-Gaussian Bộ lọc Gaussian xác định cạnh Modified Scale-invariant feature MSIFT Đặc trưng SIFT sửa đổi transform 8 DANH MỤC BẢNG Bảng 4.1 Cơ sở dữ liệu huấn luyện và so khớp trong thực nghiệm ........................ 67 Bảng 4.3 Hiệu suất trung bình từ tay trái của PUT ................................................ 68 Bảng 4.4 Hiệu suất trung bình từ tay phải của PUT .............................................. 68 9 DANH MỤC HÌNH ẢNH Hình 1.1 Các đặc điểm sinh trắc học về cơ thể và hành vi. .................................... 14 Hình 1.2 Sơ đồ khối nhận diện bằng hình ảnh vân mạch máu lòng bàn tay ........... 18 Hình 1.3 Thiết bị chụp ảnh đa phổ lòng bàn tay .................................................... 19 Hình 1.4 Sáu hình ảnh vân lòng bàn tay điển hình trong cơ sở dữ liệu .................. 20 Hình 1.5 Lưu đồ của phương pháp đường tròn nối tiếp cực đại rút trích ROI ........ 21 Hình 1.6 Hình ảnh mức xám ................................................................................. 22 Hình 1.7 Hình ảnh nhị phân sau các phép toán hình thái ....................................... 22 Hình 1.8 Hình ảnh xoay ........................................................................................ 23 Hình 1.9 Cắt hình ảnh ROI ................................................................................... 24 Hình 1.10 Hình ảnh ROI vân lòng bàn tay ............................................................ 24 Hình 1.11 Hình ảnh ROI của vân mạch máu lòng bàn tay ..................................... 24 Hình 2.3 36 mẫu bất biến xoay được tạo ra bởi phép toán 푳푩푷ퟖ, 푹풓풊 .................. 32 Hình 2.4 Phép đo kết cấu MLBP mô tả các mối quan hệ không gian trong một dải và giữa các dải ........................................................................................................... 32 Hình 2.5 Sơ đồ phép toán E – LBP4,4,3 .................................................................. 34 Hình 2.6 Mẫu 8 pixel lân cận xung quanh Z0 ........................................................ 35 Hình 2.7 Hình ảnh Gaussian liền về và sau mỗi quãng tám ................................... 41 Hình 2.8 Cực đại và cực tiểu của ảnh chênh lệch Gaussian ................................... 42 Hình 2.9 Biểu đồ số điểm chính được phát hiện trong một hình ảnh điển hình dưới dạng hàm của số lượng mẫu tỉ lệ............................................................................ 43 Hình 2.10 Dòng trên cùng trong biểu đồ hiển thị phần trăm các vị trí nổi bật được phát hiện lặp lại trong một hình ảnh đã biến đổi dưới dạng một hàm làm mịn hình ảnh trước đó cho mức độ đầu tiên của mỗi quãng tám. Dòng dưới hiển thị phần trăm bộ mô tả được so khớp chính xác với cơ sở dữ liệu lớn. ............................................. 43 Hình 2.11 Cho thấy các giai đoạn lựa chọn điểm chính......................................... 47 Hình 2.12 Dòng trên cùng trong biểu đồ hiển thị phần trăm các vị trí nổi bật và tỉ lệ được phát hiện lặp lại như một hàm của nhiễu pixel. Dòng thứ hai cho thấy độ lặp lại sau khi yêu cầu sự thống nhất trong hướng. Dòng dưới cùng hiển thị phần trăm của các bộ mô tả được so khớp chính xác với cơ sở dữ liệu lớn. .................................. 51 Hình 2.13 Mảng bộ mô tả 2x2 được tính toán từ một tập hợp 8x8 mẫu. ................ 52 10 Hình 2.14 Biểu đồ này cho thấy phần trăm các điểm chính cho kết quả so khớp chính xác với cơ sở dữ liệu gồm 40.000 điểm chính dưới dạng hàm số chiều rộng của bộ mô tả điểm chính 풏 × 풏 và số hướng trong mỗi biểu đồ. Biểu đồ được tính toán cho hình ảnh có góc nhìn affin thay đổi 50 độ và thêm 4% nhiễu. ................................ 55 Hình 2.15 Biểu đồ này cho thấy phát hiện vị trí điểm chính ổn định, hướng và so khớp cuối cùng với cơ sở dữ liệu như một hàm biến dạng affine. Mức độ biến dạng affine được biểu thị theo chiều sâu của góc quay tương đương đối với một bề mặt phẳng..................................................................................................................... 56 Hình 2.16 Các thay đổi tỉ lệ và xoay ngẫu nhiên, biến đổi affine 30 độ và nhiễu hình ảnh thêm 2% trước khi so khớp. ............................................................................ 57 Hình 2.17 Ở bên trái cách tiếp cận sử dụng SIFT; ở bên phải cách tiếp cận MSIFT trên vân lòng bàn tay không tiếp xúc. .................................................................... 58 Hình 3.1 Sơ đồ của phương pháp đề xuất. ............................................................. 62 Hình 3.2 (a) Đặc trưng CS-LBP với 8 điểm lân cận và (b) Đặc trưng ECS-LBP với 16 khối lân cận (các khối bao gồm 4 điểm) ............................................................ 63 Hình 3.3 (a), (e) Hình ảnh gốc của cùng một người, (b), (f) CS-LBP, (c), g) ECS- LBP, (d) Khớp giữa (b) và (f ), và (h) So khớp giữa (c) và (g). .............................. 64 Hình 3.4 (a), (e) Hình ảnh gốc của hai người khác nhau, (b), (f) CS-LBP, (c), (g) ECS-LBP, (d) So khớp giữa (b) và ( f), và (h) So khớp giữa (c) và (g). ................. 65 Hình 4.2 Ảnh vân mạch máu từ bàn tay trái trong cơ sở dữ liệu PUT_left_100..... 66 Hình 4.4 Ảnh vân mạch máu từ bàn tay phải trong cơ sở dữ liệu PUT_right_100 . 66 11 TÓM TẮT Gần đây, nhận dạng vân mạch máu lòng bàn tay là công nghệ sinh trắc học mới với mức độ riêng tư và bảo mật cao vì kỹ thuật này sử dụng các mạch máu dưới da lòng bàn tay để thiết lập nhận dạng. Nghiên cứu đề xuất phương pháp rút trích đặc trưng vân mạch máu lòng bàn tay mới để nhận dạng vân mạch máu lòng bàn tay không tiếp xúc dựa trên việc kết hợp mô hình nhị phân cục bộ đối xứng trung tâm (ECS-LBP) cải tiến với SIFT và MFRAT, được gọi là MFRAT SIFT - ECS-LBP. Phương pháp đề xuất bao gồm hai bước: 1) áp dụng bộ lọc MFRAT để rút trích đặc trưng hướng của đường vân. 2) Áp dụng phương pháp ECS-LBP để phát hiện các đường vân mạch máu lòng bàn tay ổn định và rõ ràng. 3) Rút trích đặc trưng cục bộ bất biến SIFT trên hình ảnh đường vân mạch máu lòng bàn tay. Kết quả thử nghiệm trên cơ sở dữ liệu vân mạch máu lòng bàn tay không tiếp xúc công khai PUT cho thấy rằng phương pháp đề xuất của đề tài đạt độ chính xác cao và mạnh mẽ để nhận dạng vân mạch máu lòng bàn tay so với các phương pháp khác. TP Hồ Chí Minh, ngày 14 tháng 5 năm 2021 Phạm Thị Quỳnh – Trần Lê Hải Bình 12 CHƯƠNG 1 TỔNG QUAN 1.1 Giới thiệu chung 1.1.1 Giới thiệu sinh trắc học Trong thời đại công nghệ phát triển, việc nhận dạng cá nhân tự động được thực hiện ngày càng nhanh chóng và dễ dàng. Công nghệ sinh trắc học ngày càng được ứng dụng phổ biến. Ví dụ ứng dụng nhận dạng vân tay trên thiết bị di động. Ứng dụng dụng này hết sức tiện lợi để bảo mật thiết bị di động. Theo kết quả từ một cuộc khảo sát gần đây, sinh trắc học được người sử dụng yêu thích và ngày càng thay thế việc sử dụng mật khẩu [1]. Sinh trắc học mang lại những lợi thế nhất định mà các cơ chế xác thực khác không thể cung cấp. Cơ chế này gắn kết chặt chẽ giữ danh tính người dùng với đặc điểm của người đó. Đặc điểm sinh trắc học này không bị mất và không bị trùng lắp [2]. Sinh trắc học có khả năng chống lại các cuộc tấn công cao hơn so với các phương pháp khác. Một trong những lợi thế chính của hệ thống nhận dạng sinh trắc học là hệ thống xác định được các người dùng đã được đăng ký trong hệ thống [3]. Ngoài ra, các hệ thống sinh trắc học yêu cầu sự hiện diện của người dùng tại thời điểm xác thực, ngăn chặn các cá nhân đưa ra các yêu cầu từ chối sai [4]. Cả hai điều khoản này đều đặc biệt quan trọng trong các ứng dụng yêu cầu bảo mật, nơi những kẻ mạo danh có thể cố gắng yêu cầu các danh tính khác nhau và đạt được lợi ích. Bên cạnh việc tăng cường bảo mật, các hệ thống sinh trắc học cũng mang lại sự tiện lợi cho người dùng bằng cách giảm bớt yêu cầu thiết kế mật khẩu và mã thông báo [5]. Hệ thống sinh trắc học sử dụng các đặc điểm cơ thể hoặc hành vi làm đặc trưng nhận dạng. Hình 1.1 minh họa một số ví dụ về các đặc điểm sinh trắc học có thể được sử dụng để xác thực người dùng. Chúng bao gồm khuôn mặt, tai, mống mắt, quét võng mạc, giọng nói, vân tay, dấu vân tay, hình dạng bàn tay/ngón tay, các mẫu vân mạch máu, nhịp tim hoặc thậm chí DNA [6], [7]. 13 Hình 1.1 Các đặc điểm sinh trắc học về cơ thể và hành vi. Đặc điểm hành vi là những đặc trưng thoái quen về hành động cơ thể của mỗi người ví dụ như: dáng đi, chữ ký, lực gõ phím/nhịp gõ, cách sử dụng chuột của máy tính và đặc điểm cầm thiết bị của người khác. Hơn nữa, các đặc trưng sinh trắc học khác như: da, mắt, màu tóc, sự hiện diện của râu, chiều cao, cân nặng, hình xăm và các yếu tố khác, cũng được sử dụng rộng rãi cho mục đích nhận diện [8]. Các thiết bị, chẳng hạn như camera từ siêu thị đến các địa điểm công cộng và đường đi, có thể xác định những người đi qua. Các hệ thống mới được thiết kế cẩn thận để có thể giảm thiểu các lỗi nhận dạng sai. Trong tương lai các hệ thống thế hệ tiếp theo có thể giảm hơn nữa lỗi nhận dạng sai bằng cách phát hiện các điều kiện làm suy yếu bất kỳ yếu tố bên ngoài nào có thể ảnh hưởng đến hiệu quả của thiết bị dựa trên sinh trắc học. 14 1.1.2 Các ứng dụng của sinh trắc học Hệ thống sinh trắc học được áp dụng trong nhiều lĩnh vực, đặc biệt là liên quan đến bảo mật như kiểm soát truy cập vật lý và logic. Bao gồm các lĩnh vực sau: 1. Dịch vụ ngân hàng/tài chính như máy ATM, thiết bị thanh toán đầu cuối, thanh toán không dùng tiền mặt, rút tiền mặt tự động, 2. Bảo mật máy tính & công nghệ thông tin như giao dịch Internet, đăng nhập máy tính cá nhân, 3. Chăm sóc sức khỏe như quan tâm đến quyền riêng tư, kiểm soát thông tin bệnh nhân, kiểm soát thuốc, 4. Nhập cư như kiểm soát biên giới, du khách thường xuyên, người tị nạn, 5. Luật pháp và trật tự xã hội như thẻ căn cước, bỏ phiếu, kiểm soát súng, nhà tù, 6. Người gác cổng/Kiểm soát ra vào cửa như thiết lập an toàn, quân đội, khách sạn, quản lý tòa nhà, 7. Viễn thông như điện thoại, gian lận thuê bao, trung tâm cuộc gọi, trò chơi, 8. Điểm danh và sự chuyên cần trong học tập và chấm công trong công ty. 9. Phúc lợi, bao gồm các dịch vụ chăm sóc sức khỏe và các khoản thanh toán phúc lợi. 10. Sản phẩm tiêu dùng như máy dịch vụ tự động, ATM, thiết bị khóa, PDA, 1.1.3 Yêu cầu của đặc trưng sinh trắc học Đặc trưng sinh trắc học cần thỏa các tính chất để có thể áp dụng được bao gồm: tính phổ biến, tính duy nhất, tính lâu dài, khả năng thu thập, khả năng đo lường, hiệu suất, khả năng chấp nhận và độ tin cậy. Trong “Sổ tay sinh trắc học” [13], “Công nghệ sinh trắc học và các hoạt động phát triển tiêu chuẩn sinh trắc học quốc tế-bảo mật” [14], các đặc tính này được trình bày như sau: Tính phổ biến: Mỗi cá nhân truy cập ứng dụng sinh trắc học phải có một phương thức cụ thể như dấu vân tay, mống mắt hoặc tai mà họ có thể sử dụng để nhận dạng bản thân. 15 Tính duy nhất: Đặc tính đã cho phải đủ khác biệt giữa các cá nhân. Các đặc điểm duy nhất có thể được sử dụng để ngăn chặn truy cập trái phép vào hệ thống sinh trắc học, ngăn chặn các cuộc tấn công. Do vậy, tính chất này hết sức quan trong, đảm bảo nhu cầu bảo mật và quyền riêng tư khi khi thiết kế hệ thống sinh trắc học. Tính lâu dài: Đặc tính sinh trắc học của một cá nhân phải đủ bất biến trong một khoảng thời gian đối với thuật toán so khớp áp dụng của hệ thống. Khả năng thu thập: Đề cập đến sự dễ dàng của việc lấy dữ liệu sinh trắc học. Có thể thu thập và số hóa các đặc trưng sinh trắc học bằng cách sử dụng các thiết bị phù hợp với các cảm biến mà không gây bất tiện quá mức cho người dùng. Bằng cách đó, chúng ta có thể rút trích và biểu diễn thành công tập dữ liệu trong các mẫu sinh trắc học. Khả năng đo lường: Bộ dữ liệu sinh trắc học phải phù hợp cho việc phân tích thống kê xác định kết quả phù hợp. Cần đánh giá độ phức tạp của các thuật toán áp dụng, thời gian tính toán và chi phí các thành phần của sơ đồ để xác định hiệu quả của hệ thống trong các ứng dụng trong thực tế. Hiệu suất: Được sử dụng để xác định độ chính xác của hệ thống nhằm cho phép người dùng được ủy quyền mới có quyền truy cập và từ chối những kẻ mạo danh. Khả năng chấp nhận: Đề cập đến cách mọi người phản ứng với hệ thống sinh trắc học, mức độ quen thuộc với các công nghệ sinh trắc học và việc sử dụng các ứng dụng (thói quen) và mức độ sẵn sàng cung cấp dữ liệu sinh trắc học. Độ tin cậy: Xác định chất lượng của đặc tính sinh trắc học. Trong cùng một ngữ cảnh, thuộc tính gian lận/giả mạo được sử dụng để đánh giá các cuộc tấn công giả mạo tiềm ẩn và đo lường mức độ dễ dàng bắt chước một đặc điểm sinh trắc học. 1.1.4 Đặc trưng vân mạch máu lòng bàn tay Nhận dạng vân mạch máu lòng bàn tay xuất hiện vào năm 1991 [17], thu hút sự chú ý của mọi người vì tính bảo mật cao, khả năng phát hiện trực tiếp, khả năng chấp nhận của người dùng và sự tiện lợi. Đặc trưng nhận dạng vân mạch máu lòng bàn tay thể hiện tính bảo mật cao, vì sử dụng mạng lưới các mạch máu dưới da lòng bàn tay 16 để nhận dạng. Vân mạch máu lòng bàn tay là thông tin sinh học bên trong cơ thể, nên những kẻ xâm nhập khó sao chép các mẫu vân mạch máu hơn nhiều so với các đặc điểm sinh trắc học khác. Mạch máu lòng bàn tay hầu như không nhìn thấy được đối với mắt người; thường được chụp dưới ánh sáng hồng ngoại (NIR). Ở trạng thái tự nhiên, các vân mạch máu lòng bàn tay được che giấu một cách tự nhiên. Hơn nữa, các mẫu vân mạch máu không bị trùng lặp ở những người khác nhau. Do đó, vân mạch máu được coi như một mã nhận dạng an toàn cao của con người. Trên thực tế, kiểu mạch máu ở tay trái và tay phải cũng khác nhau [18]. Nhận dạng vân mạch máu lòng bàn tay đảm bảo tính sống trong mẫu sinh trắc học. Nếu không có máu chảy, hình ảnh mạch máu sẽ biến mất và hệ thống nhận dạng vân mạch máu lòng bàn tay có khả năng chấp nhận cao của người dùng. Thu thập hình ảnh vân mạch máu lòng bàn tay dễ dàng và không làm phiền [19]. Vì hình ảnh mẫu vân mạch máu lòng bàn tay thu được không cần tiếp xúc trực tiếp với cảm biến rút trích mẫu vân mạch máu, nên không có sự nhiễm bẩn nào từ bề mặt sang tay của đặc trưng. Ngoài ra, các điều kiện bên ngoài từ bàn tay, như dầu mỡ và bụi bẩn, sự hao mòn của bàn tay và bề mặt tay khô và ướt không ảnh hưởng đến cấu trúc vân mạch máu. 1.2 Hệ thống nhận dạng vân mạch máu lòng bàn tay 1.2.1 Hệ thống định danh Hệ thống định danh cho biết người được định danh có trong cơ sở dữ liệu của hệ thống nhận dạng vân mạch máu và hệ thống có thể lấy ra danh tính của một người bằng cách so khớp các thuộc tính vân mạch máu của người này với các thuộc tính được lưu trữ của tất cả những người khác trong cơ sở dữ liệu. Do đó, việc định danh liên quan đến tìm kiếm một-nhiều [29]. 1.2.2 Hệ thống xác thực Hệ thống xác thực kiểm tra xác nhận danh tính được yêu cầu bởi người dùng với hệ thống. Do đó, hệ thống xác thực không cần phải so khớp các thuộc tính vân mạch máu đã chỉ định với tất cả các thuộc tính được lưu trữ; nó chỉ cần so khớp với một cặp thuộc tính, một thuộc tính đại diện cho danh tính được yêu cầu và một thuộc 17 tính khác được đo lường tại thời điểm yêu cầu. Do đó, xác thực bao gồm tìm kiếm một-một [29]. 1.2.3 Quy trình nhận dạng vân mạch máu lòng bàn tay Một hệ thống nhận dạng vân mạch máu lòng bàn tay điển hình bao gồm bốn bước: thu nhận hình ảnh vân mạch máu lòng bàn tay, tiền xử lý, đặc biệt là ở vị trí ROI, rút trích đặc trưng và so khớp, được minh họa trong Hình 1.2. Thu nhận hình ảnh vân mạch máu lòng bàn tay. Tiền xử lý trước một phần phân đoạn hình ảnh vân mạch máu lòng bàn tay để rút trích đặc trưng. Quá trình rút trích đặc trưng thu được các đặc trưng hiệu quả từ vân mạch máu lòng bàn tay được xử lý trước. So khớp đặc trưng so sánh hai đặc trưng vân mạch máu lòng bàn tay và cơ sở dữ liệu lưu trữ các mẫu đã đăng ký. Thu nhận ảnh vân mạch máu lòng bàn tay Vị trí ROI Quyết định: So khớp Rút trích Thật hoặc đặc trưng đặc trưng giả mạo Hình 1.2 Sơ đồ khối nhận diện bằng hình ảnh vân mạch máu lòng bàn tay Thu nhận ảnh 1.2.3.1.1 Giới thiệu Trong nghiên cứu sinh trắc học, kết hợp nhiều phương thức hình ảnh đã được chứng minh một cách đầy hứa hẹn để nâng cao hiệu suất nhận dạng. Theo lý thuyết điện từ, các sóng hertzian từ ánh sáng quang phổ nhìn thấy được đến tia hồng ngoại phụ cận cung cấp khả năng xâm nhập mạnh hơn vào các đặc trưng. Đối với sinh trắc học bàn tay, đèn chiếu sáng đa phổ có thể xuyên qua các mô dưới da ở các độ sâu 18 khác nhau trong các vùng lòng bàn tay và hình thành hình ảnh kết cấu bề mặt da và động mạch (bao gồm vân mạch máu lòng bàn tay). Dựa trên đặc tính này, thiết kế một thiết bị hình ảnh đa phổ để thu thập thông tin tương quan và bổ sung của bàn tay con người [15]. 1.2.3.1.2 Mô tả thu nhận ảnh Thiết bị chụp ảnh đa quang phổ lòng bàn tay, như thể hiện trong Hình 1.3. Tất cả hình ảnh lòng bàn tay với mức xám 8 bit. Đối với mỗi bàn tay, chụp hai phiên hình ảnh lòng bàn tay. Khoảng thời gian giữa hai đợt hơn một tháng. Trong mỗi phiên, có ba mẫu. Mỗi mẫu chứa sáu hình ảnh lòng bàn tay được chụp cùng một lúc với sáu quang phổ khác nhau. Bước sóng của đèn chiếu sáng tương ứng với sáu quang phổ lần lượt là 460nm, 630nm, 700nm, 850nm, 940nm và ánh sáng trắng. Giữa hai mẫu, cho phép thay đổi các tư thế tay ở một mức độ nhất định. Thông qua đó, hướng tới việc tăng tính đa dạng của các mẫu nội lớp (intra-class) và mô phỏng ứng dụng thực tế[15]. Hình 1.3 Thiết bị chụp ảnh đa phổ lòng bàn tay Trong thiết bị chụp ảnh đa phổ lòng bàn tay không có chốt để hạn chế tư thế và vị trí của lòng bàn tay. Đặc trưng được yêu cầu đặt lòng bàn tay vào thiết bị và đặt nó trước nền đồng màu. Thiết bị cung cấp ánh sáng phân bố đồng đều và chụp ảnh 19 lòng bàn tay bằng camera CCD được gắn cố định trên đáy thiết bị. Một mạch điều khiển được thiết kế để điều chỉnh phổ một cách tự động. Sáu hình ảnh vân lòng bàn tay điển hình trong cơ sở dữ liệu được hiển thị trong Hình 1.4[15]. Hình 1.4 Sáu hình ảnh vân lòng bàn tay điển hình trong cơ sở dữ liệu Tiền xử lý Rút trích ROI là một vấn đề nóng đối với việc xác định vân lòng bàn tay và vân mạch máu lòng bàn tay. Rút trích ROI đề cập đến việc thực hiện một loạt các điều chỉnh và vị trí các điểm chính (key point) cho các hình ảnh vân mạch máu lòng bàn tay và lòng bàn tay khác nhau, sau đó khu vực trung tâm hiệu quả được chọn để rút trích và so sánh đặc trưng được thực hiện để nhận dạng. Vùng trung tâm này thường được gọi là vùng quan tâm (ROI), đối với hình ảnh vân mạch máu và vân lòng bàn tay của cùng một lòng bàn tay, vị trí của ROI phải giống nhau. Mục đích xác định vị trí và lựa chọn ROI để thực hiện normalization khu vực đặc trưng các đường vân lòng bàn tay và vân mạch máu lòng bàn tay khác nhau, do đó ảnh hưởng của các yếu tố bất lợi sẽ được loại bỏ và hình ảnh phụ bao gồm thông tin đa dạng về vân lòng bàn tay hoặc vân mạch máu lòng bàn tay được rút trích thuận tiện cho việc rút trích và so khớp đặc trưng sau này. Hiện nay có rất nhiều phương pháp rút trích ROI [25-28]. Các phương pháp rút trích ROI của vân mạch máu lòng bàn tay và vân lòng bàn tay 20 dựa trên đường tròn nội tiếp cực đại [27] và phương pháp tâm [16]. Phương pháp đường tròn nội tiếp cực đại sử dụng tâm và bán kính được xác định trong lòng bàn tay, và đường tròn nội tiếp lớn nhất trong tất cả các diện tích lòng bàn tay sẽ được thực hiện, sau đó thực hiện hiệu chỉnh góc quay của lòng bàn tay. Hình vuông nội tiếp lớn nhất được cắt ra trong hình tròn nội tiếp, cuối cùng được chuẩn hóa thành kích thước của hình ảnh ROI 128 × 128. Phương pháp dựa trên việc rút trích tâm sử dụng tâm của hình ảnh lòng bàn tay đã thu được và hình ảnh con hình chữ nhật có kích thước là 256 × 256 được ngăn lại bằng cách sử dụng tâm làm trung tâm. Trong đó phương pháp đường tròn nội tiếp cực đại thường hay được sử dụng trong giai đoạn tiền xử lý để rút trích ROI, đặc trưng vân mạch máu lòng bàn tay nhận được sau khi rút trích giàu thông tin. Lưu đồ phương pháp đường tròn nội tiếp cực đại. Nhận đường Xoay hình ảnh, tròn nội tiếp cắt hình chữ Tiền xử lý cực đại nhật nội tiếp Cắt vùng ROI Cắt Nhị Hoạt động hình ảnh phân hình thái Hình 1.5 Lưu đồ của phương pháp đường tròn nối tiếp cực đại rút trích ROI Vì có một số nhiễu trên cạnh của hình ảnh, trước tiên cắt bỏ một số cạnh không cần thiết và sau đó xử lý nhị phân hình ảnh, biến ảnh thành ảnh đen trắng để giảm đáng kể chi phí tính toán. Sau khi xử lý nhị phân, hình ảnh thu được không lý tưởng, có một số đốm trắng nhỏ là nhiễu không hữu dụng. Do đó, sử dụng phép toán hình thái (morphological) để loại bỏ những nhiễu này. Ví dụ, hình ảnh bảng màu dưới nguồn sáng trắng được chọn ngẫu nhiên từ cơ sở dữ liệu CASIA [15]. Hình 1.6 là hình ảnh màu xám và Hình 1.7 là hình ảnh nhị phân sau các phép toán hình thái. 21 Hình 1.6 Hình ảnh mức xám Hình 1.7 Hình ảnh nhị phân sau các phép toán hình thái Bởi vì mỗi người có kích thước lòng bàn tay khác nhau và vị trí của lòng bàn tay cũng khác nhau khi thu thập các bảng màu, phương pháp xác định vị trí dựa trên đường tròn nội tiếp cực đại. Cách tiếp cận này tận dụng các đặc điểm đường viền hình dạng bàn tay, các bước cụ thể như sau: 1) Sau khi tiền xử lý, thu được hình ảnh nhị phân của lòng bàn tay, điểm trung tâm của đường tròn nội tiếp cực đại trong lòng bàn tay nằm trong vùng lòng bàn tay. Để nâng cao hơn nữa hiệu quả của các phép tính, điểm trung tâm có thể nằm trong lòng bàn tay xung quanh tâm. Sử dụng tâm làm điểm gốc để xác định một hình chữ nhật có chiều dài nhất định. Theo kinh nghiệm, thường xác định kích thước hình chữ nhật là 100 × 100. Tìm kiếm tâm vòng tròn trong khu vực này sẽ cải thiện hiệu quả rất nhiều. 2) Lấy một điểm trong hình chữ nhật làm tâm của đường tròn và thay đổi dần bán kính của hình tròn. Khi cạnh của vòng tròn này rơi vào cạnh của vân mạch máu lòng bàn tay, sẽ ngừng tìm kiếm bán kính và ghi lại bán kính của hình tròn này. 22 3) Thay đổi tâm của đường tròn và tiếp tục tìm bán kính của đường tròn. Cuối cùng, ghi lại tâm điểm và bán kính của hình tròn lớn nhất. Đường tròn này là đường tròn nội tiếp cực đại của toàn bộ diện tích lòng bàn tay. Không có giới hạn đối với vị trí xoay của lòng bàn tay khi thu thập hình ảnh, vì vậy thực hiện hiệu chỉnh xoay hình ảnh lòng bàn tay trước khi ROI bị chặn. Ngoài tâm O, đặt thêm một điểm tham chiếu L. Xác định bán kính đường tròn nội tiếp lớn nhất bằng R, lấy tâm của đường tròn làm gốc, vẽ đường tròn với KR (K> 1), đường tròn sẽ giao nhau với các ngón tay. Tìm giao điểm A, B của ngón giữa và ngón đeo nhẫn, sau đó nhận được điểm trung tâm L, nối OL là trục tọa độ x mới như Hình 1.8. Trong tọa độ mới, hình ảnh lòng bàn tay được xoay. Hình 1.8 Hình ảnh xoay Và sau đó, lấy O làm tâm, R là bán kính và lấy kích thước R × R của hình ảnh con có kích thước không cố định. Đó là trong hình tròn nội tiếp cực đại, tiến hành chặn hình vuông nội tiếp lón nhất là ROI, và sau đó chuẩn hóa thành kích thước 128 × 128. Các thực nghiệm sau sử dụng bảng màu dưới nguồn sáng trắng làm ví dụ, kết quả được thể hiện trong Hình 1.9 và 1.10. 23 Hình 1.9 Cắt hình ảnh ROI Hình 1.10 Hình ảnh ROI vân lòng bàn tay Hình ảnh vân mạch máu lòng bàn tay và hình ảnh lòng bàn tay tương tự nhau, cả hai đều là từ lòng bàn tay, nhưng dưới các bước sóng khác nhau của nguồn sáng, thông tin hiển thị là khác nhau. Dưới nguồn ánh sáng trắng, thông tin về vân lòng bàn tay được hiển thị và dưới ánh sáng hồng ngoại gần 850nm, thông tin về vân mạch máu lòng bàn tay được thể hiện, vì vậy các bước rút trích giống nhau. Hình ảnh ROI vân mạch máu lòng bàn tay được trích xuất cuối cùng được hiển thị trong Hình 1.11. Có thông tin đa dạng về vân mạch máu lòng bàn tay trong hình ảnh. Hình 1.11 Hình ảnh ROI của vân mạch máu lòng bàn tay Rút trích đặc trưng và so khớp Khi hình ảnh ROI đượ...ỗi quãng tám. Việc lặp lại không tiếp tục được cải thiện khi có nhiều tỉ lệ hơn được lấy mẫu. Vì điều này dẫn đến nhiều điểm cực trị cục bộ hơn được phát hiện, nhưng các điểm cực trị này trung bình kém ổn định hơn và do đó ít có khả năng được phát hiện trong hình ảnh đã biến đổi. Điều này được thể hiện bằng biểu đồ thứ hai trong Hình 2.9, cho thấy số lượng trung bình các điểm chính được phát hiện và so khớp chính xác trong mỗi hình ảnh. Số lượng các điểm chính tăng lên cùng với việc tăng mẫu tỉ lệ và tổng số các kết quả so khớp chính xác cũng tăng lên. Việc nhận dạng đặc trưng thường phụ thuộc nhiều vào số lượng các điểm chính được so khớp chính xác, trái ngược với 44 tỉ lệ phần trăm so khớp đúng của chúng, nên đối với nhiều ứng dụng, sẽ là tối ưu khi sử dụng số lượng mẫu theo tỉ lệ lớn hơn. Tuy nhiên, chi phí tính toán cũng tăng theo. Tóm lại, các thực nghiệm này cho thấy rằng hàm không gian tỉ lệ DoG có một số lượng lớn các cực trị và sẽ rất tốn kém để phát hiện tất cả các điểm này. Tuy nhiên, chúng ta có thể phát hiện ra tập hợp con hữu ích và ổn định khi lấy mẫu theo tỉ lệ thô. 2.4.1.2.3 Tần suất lấy mẫu trong miền không gian Xác định tần số lấy mẫu trong miền ảnh so với tỉ lệ làm mịn. Các điểm cực trị có thể gần nhau một cách tùy ý, có sự cân bằng tương tự giữa tần suất lấy mẫu và tốc độ phát hiện. Hình 2.10 xác định thực nghiệm về lượng làm mịn trước, 휎, được áp dụng cho mỗi cấp độ hình ảnh trước khi xây dựng biểu diễn không gian tỉ lệ cho một quãng tám. Điểm mấu chốt là khả năng lặp lại phát hiện điểm chính, và kết quả cho thấy độ lặp lại tiếp tục tăng theo 휎. Tuy nhiên, chi phí để sử dụng 휎 lớn về mặt hiệu quả, chọn sử dụng 휎 = 1.6, gần với độ lặp lại tối ưu. Giá trị này được sử dụng cho kết quả trong Hình 2.9. Làm mịn hình ảnh trước khi phát hiện điểm cực trị, sẽ loại bỏ các tần số không gian cao nhất một cách hiệu quả. Do đó, để tận dụng tối đa đầu vào, hình ảnh có thể được mở rộng để tạo ra nhiều điểm mẫu hơn so với hình ảnh ban đầu. Tăng gấp đôi kích thước của hình ảnh đầu vào bằng cách sử dụng tuyến tính. Có thể thực hiện một cách hiệu quả bằng cách sử dụng các bộ lọc subpixel-offset trên hình ảnh gốc, việc nhân đôi hình ảnh dẫn đến việc triển khai hiệu quả hơn. Giả định rằng hình ảnh gốc có độ mờ ít nhất là 휎 = 0.5 (mức tối thiểu cần thiết để ngăn hiện tượng lỗi đáng kể) và do đó hình ảnh được nhân đôi có 휎 = 1.0 so với khoảng cách pixel mới. Điều này có nghĩa là cần phải làm mịn thêm hình ảnh trước khi tạo ra quãng tám đầu tiên của không gian tỉ lệ. Việc nhân đôi hình ảnh làm tăng số lượng điểm chính ổn định lên hệ số 4, nhưng không tìm thấy cải tiến đáng kể nào với hệ số mở rộng lớn hơn. Định vị điểm chính Khi một điểm chính nổi bật được tìm thấy bằng cách so sánh một pixel với các điểm ảnh lân cận, bước tiếp theo thực hiện so khớp chi tiết với dữ liệu lân cận về vị trí, tỉ lệ và các độ cong chính. Thông tin này cho phép loại bỏ các điểm có độ tương 45 phản thấp (và do đó nhạy cảm với nhiễu) hoặc được khoanh vùng kém dọc theo một cạnh. Ban đầu phương pháp này (Lowe, 1999) chỉ đơn giản là định vị các điểm chính ở vị trí và tỉ lệ của điểm mẫu trung tâm. Tuy nhiên, Brown đã phát triển một phương pháp (Brown và Lowe, 2002) để so khớp một hàm bậc hai 3D với các điểm mẫu cục bộ để xác định vị trí nội suy của điểm cực đại, và các thực nghiệm cho thấy rằng điều này cung cấp một cải tiến đáng kể cho việc so khớp và ổn định. Cách tiếp cận của ông sử dụng hàm mở rộng không gian tỉ lệ của Taylor (lên đến các số hạng bậc hai), 퐷(푥, 푦, 휎), được dịch chuyển sao cho điểm gốc là điểm mẫu: 휕퐷푇 1 휕2퐷 퐷(푋) = 퐷 + 푋 + 푋푇 푋 (2.10) 휕푋 2 휕푋2 trong đó D và các đạo hàm được đánh giá tại điểm mẫu và 푋 = (푥, 푦, 휎)푇 là phần bù từ điểm này. Vị trí của điểm cực trị, 푋̂, được xác định bằng cách lấy đạo hàm của hàm này đối với 푋 và gán giá trị bằng 0, theo công thức 휕2퐷−1 휕퐷 푋̂ = − (2.11) 휕푋2 휕푋 46 Hình 2.9 Cho thấy các giai đoạn lựa chọn điểm chính. (a) Hình ảnh gốc 233x189 pixel. (b) 832 điểm chính ban đầu xác định vị trí tại cực đại và cực tiểu của DoG. Các điểm chính được hiển thị dưới dạng vectơ cho biết tỉ lệ, hướng và vị trí. (c) Sau khi áp dụng ngưỡng về độ tương phản tối thiểu, 729 điểm chính vẫn còn. (d) 536 điểm chính cuối cùng vẫn tuân theo một ngưỡng bổ sung về tỉ lệ độ cong chính. Theo đề xuất của Brown, Hessian và đạo hàm của D được tính gần đúng bằng cách sử dụng sự khác biệt của các điểm mẫu lân cận. Kết quả hệ thống tuyến tính 3x3 có thể được giải quyết với chi phí tối thiểu. Nếu độ lệch 푋̂ lớn hơn 0,5 theo bất kỳ hướng nào, điều đó cho biết điểm cực trị nằm gần một điểm mẫu khác hơn. Trong trường hợp này, điểm mẫu được thay đổi và thực hiện nội suy thay thế cho điểm đó. Phần bù cuối cùng 푋̂ được thêm vào vị trí của điểm mẫu để có được ước lượng nội suy cho vị trí của điểm cực trị. Giá trị hàm tại điểm cực trị, D (푋̂), rất hữu ích để loại bỏ điểm cực trị không ổn định với độ tương phản thấp. Điều này có thể nhận được bằng cách thay thế phương trình (2.11) vào (2.10), cho như sau 47 1 휕퐷푇 퐷(푋̂) = 퐷 + 푋̂ 2 휕푋 Hình 2.11 cho thấy các tác động của việc chọn điểm chính đối với hình ảnh tự nhiên. Để tránh quá nhiều xáo trộn, hình ảnh có độ phân giải thấp 233 x 189 pixel được sử dụng và các điểm chính được hiển thị dưới dạng vectơ cho biết vị trí, tỉ lệ và hướng của mỗi điểm chính. Hình 2.11 (a) cho thấy hình ảnh ban đầu, được hiển thị ở độ tương phản giảm phía sau các hình tiếp theo. Hình 2.11 (b) cho thấy 832 điểm chính ở tất cả các điểm cực đại và cực tiểu được phát hiện của hàm DoG, trong khi (c) cho thấy 729 điểm chính vẫn còn sau khi loại bỏ các điểm có giá trị là |(푋̂)| nhỏ hơn 0,03. Phần (d) sẽ được giải thích trong phần sau. 2.4.1.3.1 Loại bỏ cạnh không ổn định Để ổn định, không đủ để loại bỏ các điểm chính có độ tương phản thấp. Hàm DoG phản hồi mạnh mẽ dọc theo các cạnh, ngay cả khi vị trí dọc theo cạnh được xác định kém và do đó không ổn định đối với lượng nhiễu nhỏ. Một đỉnh được xác định kém trong hàm DoG sẽ có độ cong chính lớn qua cạnh nhưng lại nhỏ theo hướng vuông góc. Các độ cong chính có thể được tính toán từ ma trận Hessian 2x2, 푯, được tính toán tại vị trí và tỉ lệ của điểm chính: 퐷 퐷 푯 = [ 푥푥 푥푦] (2.12) 퐷푥푦 퐷푦푦 Các đạo hàm được ước tính bằng cách lấy sự khác biệt của các điểm mẫu lân cận. Các giá trị riêng của 푯 tỉ lệ với độ cong chính của D. Mượn từ cách tiếp cận được sử dụng bởi Harris và Stephens (1988), có thể tránh tính toán rõ ràng các giá trị riêng, chỉ quan tâm đến tỉ lệ của chúng. Gọi 훼 là giá trị riêng có độ lớn lớn nhất và 훽 là giá trị nhỏ hơn. Sau đó, có thể tính tổng các giá trị riêng từ dấu vết của 푯 và tích của chúng từ yếu tố quyết định: 푇푟(푯) = 퐷푥푥 + 퐷푦푦 = 훼 + 훽, 2 퐷푒푡(푯) = 퐷푥푥퐷푦푦 − (퐷푥푦) = 훼훽. 48 Trong trường hợp không chắc chắn rằng yếu tố xác định là âm, các đường cong có các dấu hiệu khác nhau nên điểm bị loại bỏ vì không phải là điểm cực trị. Gọi 푟 là tỷ số giữa cường độ giá trị riêng lớn nhất và giá trị nhỏ hơn, sao cho 훼 = 푟훽. Sau đó, 푇푟(푯)2 (훼 + 훽)2 (푟훽 + 훽)2 (푟 + 1)2 = = = , 퐷푒푡(푯) 훼훽 푟훽2 푟 điều này chỉ phụ thuộc vào tỉ lệ của các giá trị riêng. Đại lượng (푟 + 1)2⁄푟 là nhỏ nhất khi hai giá trị riêng bằng nhau và tăng theo 푟. Do đó, để kiểm tra tỉ lệ độ cong cơ bản dưới ngưỡng nào đó, 푟, chúng ta chỉ cần kiểm tra 푇푟(푯)2 (푟 + 1)2 < . 퐷푒푡(푯) 푟 Điều này hiệu quả để tính toán, với ít hơn 20 phép toán số thực dấu phẩy động được yêu cầu để kiểm tra mỗi điểm chính. Xác định hướng Bằng cách gán một hướng thích hợp cho mỗi điểm chính dựa trên các thuộc tính hình ảnh cục bộ, bộ mô tả điểm chính có thể được biểu diễn liên quan đến hướng này và do đó đạt được sự bất biến đối với việc xoay hình ảnh. Nhược điểm của cách tiếp cận là hạn chế các bộ mô tả có thể được sử dụng và loại bỏ thông tin hình ảnh do không yêu cầu tất cả sự đo lường phải dựa trên việc xoay hình ảnh thích hợp. Tỉ lệ của điểm chính được sử dụng để chọn hình ảnh làm mịn Gaussian, 퐿, với tỉ lệ gần nhất, để tất cả các phép tính được thực hiện theo tỉ lệ bất biến. Đối với mỗi mẫu hình ảnh, 퐿(푥, 푦), ở tỉ lệ này, cường độ gradient, 푚(푥, 푦) và hướng, 휃(푥, 푦), được tính toán trước bằng cách sử dụng các pixel khác nhau: 2 2 푚(푥, 푦) = √(퐿(푥 + 1, 푦) − 퐿(푥 − 1, 푦)) + (퐿(푥, 푦 + 1) − 퐿(푥, 푦 − 1)) 휃(푥, 푦) = 푡푎푛−1 ((푥, 푦 + 1) − 퐿(푥, 푦 − 1))⁄(퐿(푥 + 1, 푦) − 퐿(푥 − 1, 푦)) Biểu đồ hướng được hình thành từ các hướng gradient của các điểm mẫu trong vùng xung quanh điểm chính. Biểu đồ hướng có 36 bin bao gồm phạm vi hướng 360 49 độ. Mỗi mẫu được thêm vào biểu đồ được tính trọng số bằng độ lớn gradient và vòng tròn có trọng số Gaussian với 휎 gấp 1,5 lần tỉ lệ của điểm chính. Các đỉnh trong biểu đồ hướng tương ứng với các hướng chính của gradient cục bộ. Đỉnh cao nhất trong biểu đồ được phát hiện và sau đó bất kỳ đỉnh cục bộ nào khác nằm trong khoảng 80% của đỉnh cao nhất cũng được sử dụng để tạo ra một điểm chính với hướng đó. Do đó, đối với các vị trí có nhiều đỉnh có độ lớn tương tự nhau, sẽ có nhiều điểm chính được tạo ra tại cùng một vị trí và tỉ lệ nhưng hướng khác nhau. Khoảng 15% số điểm được gán nhiều hướng, nhưng những điểm này góp phần đáng kể vào sự ổn định khi so khớp. Cuối cùng, một parabol phù hợp với 3 giá trị biểu đồ gần nhất với mỗi đỉnh để nội suy vị trí đỉnh có độ chính xác tốt hơn. Hình 2.12 cho thấy sự ổn định về vị trí, tỉ lệ và phân định hướng dưới các lượng nhiễu ảnh khác nhau. Như trước đây, các hình ảnh được xoay và thu nhỏ theo số lượng ngẫu nhiên. Dòng trên cùng cho thấy sự ổn định của vị trí nổi bật và chỉ định tỉ lệ. Dòng thứ hai cho thấy sự ổn định trong so khớp khi hướng được yêu cầu trong phạm vi 15 độ. Như được hiển thị bởi khoảng cách giữa hai dòng trên cùng, việc gán hướng vẫn chính xác 95% thời gian ngay cả sau khi thêm nhiễu điểm ảnh ± 10%. Phương sai hướng đo được cho các kết quả phù hợp chính xác là khoảng 2,5 độ, tăng lên 3,9 độ đối với nhiễu 10%. Dòng dưới cùng trong Hình 2.12 cho thấy độ chính xác cuối cùng của việc so khớp chính xác một bộ mô tả điểm chính với cơ sở dữ liệu gồm 40.000 điểm chính. Như biểu đồ này cho thấy, các đặc trưng SIFT có khả năng chống lại lượng lớn nhiễu pixel và nguyên nhân chính gây ra lỗi là do phát hiện vị trí và tỉ lệ ban đầu. 50 Hình 2.10 Dòng trên cùng trong biểu đồ hiển thị phần trăm các vị trí nổi bật và tỉ lệ được phát hiện lặp lại như một hàm của nhiễu pixel. Dòng thứ hai cho thấy độ lặp lại sau khi yêu cầu sự thống nhất trong hướng. Dòng dưới cùng hiển thị phần trăm của các bộ mô tả được so khớp chính xác với cơ sở dữ liệu lớn. Bộ mô tả điểm chính Các thao tác trước đó đã chỉ định vị trí, tỉ lệ và hướng hình ảnh cho mỗi điểm chính. Các tham số này áp đặt một hệ tọa độ cục bộ 2D có thể lặp lại để mô tả vùng ảnh cục bộ và do đó cung cấp sự bất biến cho các tham số. Bước tiếp theo là tính toán bộ mô tả cho vùng hình ảnh cục bộ có tính phân biệt cao nhưng bất biến nhất đối với các biến thể còn lại, chẳng hạn như sự thay đổi về độ chiếu sáng hoặc góc nhìn 3D. Một cách tiếp cận rõ ràng là lấy mẫu các cường độ hình ảnh cục bộ xung quanh điểm chính ở tỉ lệ thích hợp và so khớp các cường độ này bằng cách sử dụng một thước đo tương quan chuẩn hóa. Tuy nhiên, mối tương quan đơn giản của các mảng hình ảnh rất nhạy cảm với những thay đổi gây ra đăng ký sai mẫu, chẳng hạn như thay đổi góc nhìn affine hoặc 3D hoặc các biến dạng linh hoạt. Một bộ mô tả điểm chính được tạo ra bằng cách tính toán độ lớn và hướng gradient tại mỗi điểm mẫu ảnh trong vùng xung quanh vị trí điểm chính, như được hiển thị bên trái. Cân bằng Gaussian, được biểu thị bằng vòng tròn phủ. Sau đó, các mẫu này được tích lũy thành các biểu đồ hướng tóm tắt nội dung trên các tiểu vùng 51 4x4, như được hiển thị ở bên phải, với độ dài của mỗi mũi tên tương ứng với tổng độ lớn của gradient gần hướng đó trong vùng. Hình 2.11 Mảng bộ mô tả 2x2 được tính toán từ một tập hợp 8x8 mẫu. 2.4.1.5.1 Biểu diễn bộ mô tả (Descriptor representation) Hình 2.13 minh họa tính toán của bộ mô tả điểm chính. Đầu tiên, cường độ và hướng của hình ảnh gradient được lấy mẫu xung quanh vị trí điểm chính, sử dụng tỉ lệ của điểm chính để chọn mức độ mờ Gaussian cho hình ảnh. Để đạt được hướng bất biến, tọa độ của bộ mô tả và các hướng gradient được xoay so với hướng của điểm chính. Để đạt hiệu quả cao, các độ dốc được tính toán trước cho tất cả các cấp của hình chóp. Được minh họa bằng các mũi tên nhỏ tại mỗi vị trí mẫu ở bên trái của Hình 2.13. Một hàm trọng số Gaussian với 휎 bằng một nửa chiều rộng của bộ mô tả được sử dụng để gán trọng số cho độ lớn của mỗi điểm mẫu. Điều này được minh họa bằng hình tròn bên trái của Hình 2.13. Mục đích của hàm Gaussian này là để tránh những thay đổi đột ngột trong bộ mô tả với những thay đổi nhỏ về vị trí của và ít nhấn mạnh hơn đến các gradient ở xa tâm của bộ mô tả, vì chúng bị ảnh hưởng nhiều nhất bởi lỗi đăng ký sai. Bộ mô tả điểm quan trọng được hiển thị ở bên phải của Hình 2.13. Cho phép thay đổi các vị trí gradient bằng cách tạo các biểu đồ hướng trên các vùng mẫu 4x4. Hình ảnh cho thấy tám hướng của từng biểu đồ hướng, với độ dài của mỗi mũi tên 52 tương ứng với độ lớn đầu vào biểu đồ đó. Một mẫu gradient ở bên trái có thể thay đổi đến 4 vị trí mẫu, do đó cho phép dịch chuyển vị trí cục bộ lớn hơn. Tránh tất cả các ảnh hưởng đến đường biên trong đó bộ mô tả thay đổi đột ngột khi một mẫu chuyển dịch từ biểu đồ này sang biểu đồ khác hoặc từ hướng này sang hướng khác. Do đó, phép nội suy ba tuyến được sử dụng để phân phối giá trị của mỗi mẫu gradient vào các ngăn biểu đồ liền kề. Nói cách khác, mỗi đầu vào từng ngăn được nhân với trọng lượng 1 − 푑 cho mỗi kích thước, trong đó 푑 là khoảng cách của mẫu từ giá trị trung tâm của từng ngăn như được đo bằng đơn vị của khoảng cách từng ngăn của biểu đồ. Bộ mô tả được hình thành từ một vectơ chứa các giá trị của tất cả các đầu vào biểu đồ hướng, tương ứng với độ dài của các mũi tên ở phía bên phải của Hình 2.13. Hình vẽ cho thấy một mảng biểu đồ hướng 2x2. Cuối cùng, vector đặc trưng được sửa đổi để giảm tác động của sự thay đổi độ chiếu sáng. Đầu tiên, vectơ được chuẩn hóa thành độ dài đơn vị. Một sự thay đổi về độ tương phản của hình ảnh trong đó mỗi giá trị pixel được nhân với một hằng số sẽ nhân gradient với cùng một hằng số, do đó, sự thay đổi độ tương phản này sẽ bị hủy bỏ bằng cách chuẩn hóa vectơ. Thay đổi độ sáng trong đó một hằng số được thêm vào mỗi pixel hình ảnh sẽ không ảnh hưởng đến các giá trị gradient. Do đó, bộ mô tả là bất biến đối với những thay đổi của affin trong độ chiếu sáng. Tuy nhiên, những thay đổi về độ chiếu sáng không tuyến tính cũng có thể xảy ra do độ bão hòa của máy ảnh hoặc do những thay đổi về độ chiếu sáng ảnh hưởng đến các bề mặt 3D với các hướng khác nhau theo số lượng khác nhau. Những hiệu ứng này có thể gây ra sự thay đổi lớn về cường độ tương đối đối với một số gradient, nhưng ít có khả năng ảnh hưởng đến các hướng gradient. Do đó, giảm ảnh hưởng của các cường độ gradient lớn bằng cách đặt ngưỡng các giá trị trong vectơ đặc trưng đơn vị không lớn hơn 0,2, sau đó chuẩn hóa lại thành độ dài đơn vị. Việc so khớp các cường độ cho các gradient lớn không còn quan trọng và sự phân bố các hướng có trọng tâm hơn. Giá trị 0,2 được xác định bằng thực nghiệm sử dụng các hình ảnh có độ chiếu sáng khác nhau cho các đặc trưng 3D giống nhau. 53 2.4.1.5.2 Kiểm tra bộ mô tả Có hai tham số có thể được sử dụng để thay đổi độ phức tạp của bộ mô tả: số hướng, 푟, trong biểu đồ và chiều rộng, 푛, của dãy 푛 × 푛 biểu đồ hướng. Kích thước của vector bộ mô tả kết quả là 푟푛2. Khi độ phức tạp của bộ mô tả tăng lên, có thể phân biệt tốt hơn trong một cơ sở dữ liệu lớn, nhưng cũng nhạy cảm hơn với các biến thể và hấp thụ hình dạng. Hình 2.14 cho thấy các kết quả thực nghiệm trong đó số lượng hướng và kích thước của bộ mô tả khác nhau. Biểu đồ được tạo để chuyển đổi điểm nhìn trong đó bề mặt phẳng nghiêng 50 độ so với người xem và thêm 4% nhiễu hình ảnh. Điều này gần giới hạn của so khớp đáng tin cậy, vì trong những trường hợp khó hơn, hiệu suất của bộ mô tả là quan trọng nhất. Kết quả cho thấy phần trăm các điểm chính tìm thấy so khớp chính xác với lân cận gần nhất trong cơ sở dữ liệu gồm 40.000 điểm chính. Biểu đồ cho thấy hướng đơn (푛 = 1) rất kém trong việc phân biệt, nhưng kết quả tiếp tục cải thiện trên mảng 4x4 biểu đồ với 8 hướng. Việc thêm nhiều hướng hơn hoặc bộ mô tả lớn hơn thực sự có thể làm ảnh hưởng đến việc so khớp bằng cách làm cho bộ mô tả nhạy cảm hơn với sự biến dạng. Các kết quả này gần như tương tự đối với các mức độ thay đổi góc nhìn và nhiễu khác, mặc dù trong một số trường hợp đơn giản hơn, sự phân biệt tiếp tục được cải thiện với kích thước bộ mô tả 5x5 và cao hơn. 54 Hình 2.12 Biểu đồ này cho thấy phần trăm các điểm chính cho kết quả so khớp chính xác với cơ sở dữ liệu gồm 40.000 điểm chính dưới dạng hàm số chiều rộng của bộ mô tả điểm chính 풏 × 풏 và số hướng trong mỗi biểu đồ. Biểu đồ được tính toán cho hình ảnh có góc nhìn affin thay đổi 50 độ và thêm 4% nhiễu. 2.4.1.5.3 Tính nhạy cảm với việc cho phép thay đổi Độ nhạy của bộ mô tả đối với sự thay đổi affine được xem xét trong Hình 2.15. Biểu đồ cho thấy độ tin cậy của vị trí điểm chính và lựa chọn tỉ lệ, gán hướng và so khớp vùng gần nhất với cơ sở dữ liệu. Để đạt được sự so khớp đáng tin cậy trên một góc quan sát rộng hơn, một trong các bộ phát hiện bất biến affine có thể được sử dụng để chọn và lấy mẫu lại các vùng ảnh. Những bất lợi là giá trị tính toán cao hơn nhiều, giảm số lượng các điểm chính và độ ổn định kém hơn đối với các thay đổi affine nhỏ do lỗi trong việc gán khung liên kết thích hợp dưới nhiễu. Trên thực tế, phạm vi xoay cho phép đối với các đặc trưng 3D ít hơn so với các bề mặt phẳng, do đó, sự bất biến affine thường không phải là yếu tố giới hạn trong khả năng so khớp qua sự thay đổi góc nhìn. Nếu mong muốn một loạt các bất biến affine, chẳng hạn như đối với một bề mặt được biết là phẳng, một giải pháp đơn giản là áp dụng phương pháp của Pritchard và Heidrich (2003), trong đó các đặc trưng SIFT bổ sung được tạo ra từ 4 phiên bản định dạng affine hình ảnh huấn luyện tương ứng với góc nhìn 60 độ thay đổi. Điều này cho phép sử dụng các đặc trưng SIFT tiêu chuẩn mà không mất thêm chi phí khi xử lý hình ảnh để được nhận dạng, nhưng dẫn đến việc tăng kích thước của cơ sở dữ liệu đặc trưng lên hệ số 3. 55 Hình 2.13 Biểu đồ này cho thấy phát hiện vị trí điểm chính ổn định, hướng và so khớp cuối cùng với cơ sở dữ liệu như một hàm biến dạng affine. Mức độ biến dạng affine được biểu thị theo chiều sâu của góc quay tương đương đối với một bề mặt phẳng. 2.4.1.5.4 Sơ khớp với cơ sở dữ liệu lớn Để đo lường tính phân biệt của các đặc trưng là độ tin cậy của so khớp thay đổi như thế nào khi là một hàm số lượng đặc trưng trong cơ sở dữ liệu được so khớp. Hình 2.16 cho thấy độ tin cậy phù hợp thay đổi như thế nào khi là một hàm của kích thước cơ sở dữ liệu. Hình này được tạo ra bằng cách sử dụng cơ sở dữ liệu lớn hơn gồm 112 hình ảnh, với góc quay 30 độ theo chiều sâu và nhiễu hình ảnh 2% bên cạnh việc xoay hình ảnh ngẫu nhiên và thay đổi tỉ lệ thông thường. Đường nét đứt hiển thị phần đặc trưng hình ảnh cục bộ mà lân cận gần nhất trong cơ sở dữ liệu so khớp đúng, như một hàm kích thước cơ sở dữ liệu được hiển thị trên thang logarit. Điểm ngoài cùng bên trái đang so khớp với các đặc trưng chỉ từ một hình ảnh trong khi điểm ngoài cùng bên phải đang chọn các kết quả phù hợp từ cơ sở dữ liệu của tất cả các đặc trưng từ 112 hình ảnh. Có thể thấy rằng độ tin cậy của so khớp giảm đi khi là một hàm của số lượng yếu tố gây phân tán, nhưng tất cả các dấu hiệu cho thấy rằng nhiều so khớp chính xác sẽ tiếp tục được tìm thấy với kích thước cơ sở dữ liệu lớn. 56 Đường nét liền là tỉ lệ phần trăm các điểm chính đã được xác định tại vị trí và hướng so khớp chính xác trong hình ảnh đã biến đổi, vì vậy chỉ những điểm này mới có bộ mô tả phù hợp trong cơ sở dữ liệu. Khoảng cách giữa hai dòng là nhỏ, cho thấy rằng các lỗi so khớp là do các vấn đề định vị đặc trưng ban đầu và gán hướng hơn là các vấn đề về tính phân biệt của đặc trưng, ngay cả do kích thước cơ sở dữ liệu lớn. Hình 2.14 Các thay đổi tỉ lệ và xoay ngẫu nhiên, biến đổi affine 30 độ và nhiễu hình ảnh thêm 2% trước khi so khớp. Đường nét đứt cho thấy phần trăm các điểm chính được so khớp chính xác với cơ sở dữ liệu dưới dạng một hàm kích thước cơ sở dữ liệu (sử dụng thang đo logarit). Đường nét liền hiển thị phần trăm các điểm chính được chỉ định vị trí, tỉ lệ và hướng chính xác 2.4.2 Đặc trưng SIFT sửa đổi SIFT ban đầu được đề xuất trong [75]. Trong [76], tiện ích của các đặc trưng SIFT để nhận dạng vân lòng bàn tay đã được kiểm tra với kết quả tương đối kém bằng cách sử dụng hình ảnh thu được từ máy quét phẳng. Các đặc trưng được rút trích không thay đổi đối với tỉ lệ hình ảnh, xoay và một phần bất biến để thay đổi độ sáng và độ méo hình ảnh. SIFT là một phương pháp rút trích đặc trưng dựa trên việc rút trích thông tin cục bộ. Hình 2.17 tiếp tục các giai đoạn chính để tạo ra tập hợp các 57 đặc trưng do Lowe [75] đề xuất và đề xuất điều chỉnh với hệ thống sinh trắc học không tiếp xúc vân lòng bàn tay được gọi là MSIFT. Hình 2.15 Ở bên trái cách tiếp cận sử dụng SIFT; ở bên phải cách tiếp cận MSIFT trên vân lòng bàn tay không tiếp xúc. Thuật toán SIFT dựa trên việc phát hiện các điểm chính có các thuộc tính tương tự có trong hình ảnh tham chiếu và hình ảnh được hỏi. Trong các hình ảnh được thu nhận không tiếp xúc khi di chuyển bằng tay có độ phân giải thấp (800 × 600) và hình ảnh mờ, có một số biến dạng làm giảm khả năng phát hiện các điểm chính chung. Để giảm bớt vấn đề này, một quy trình tiền xử lý làm nổi bật các điểm chính quan tâm. Thuật toán tiền xử lý hình ảnh thu được áp dụng thuật toán SIFT trước đó được gọi là SIFT đã sửa đổi (MSIFT) và bao gồm sáu bước. Tiền xử lý So sánh đánh giá một số lựa chọn thay thế tiền xử lý để thêm mạnh mẽ cho phương pháp rút trích đặc trưng dựa trên SIFT: cân bằng biểu đồ thích ứng giới hạn tương phản, lọc Gaussian và lọc Gabor. 58 Cân bằng biểu đồ thích ứng giới hạn độ tương phản [77] là một phương pháp tiền xử lý được sử dụng để cải thiện độ tương phản trong hình ảnh. Đối với hình ảnh đầu vào 퐼(푥, 푦), hàm phân phối tích lũy được sử dụng để ước tính biểu đồ hình ảnh và độ dốc mong muốn tối đa để giới hạn độ tương phản. Hàm được sử dụng để chuyển đổi hàm mật độ độ xám thành một hàm mật độ xấp xỉ đồng đều. Bộ lọc Gaussian dựa trên bộ lọc Gaussian 2D để thu được cường độ trung bình có trọng số của một vùng dạng đường. Biểu hiện như sau: 푥푐표푠휃 + 푦푠푖푛휃 2 푥푠푖푛휃 + 푦푐표푠휃 2 푓(푥, 푦, 휃) = 푒푥푝 [− ( ) − ( ) ] 훿푥 훿푦 trong đó 휃 biểu thị hướng của bộ lọc Gaussian 2D, 훿푥 biểu thị tỉ lệ ngang của bộ lọc và 훿푦 biểu thị thông số tỉ lệ dọc của bộ lọc. Theo kinh nghiệm, nên lựa chọn các tham số là 휃 = 0, 훿푥 = 5 và 훿푥 = 1. Bộ lọc thực Gabor 2D được sử dụng để tiền xử lý hình ảnh bảng màu được định nghĩa như sau: 1 푥2 + 푦2 퐺(푥, 푦, 휃, 푢, 휑) = 푒푥푝 {− } × 푐표푠{2휋(푢푥 cos 휃 + 푢푦 sin 휃)} 2휋휑2 2휑2 trong đó 푢 là tần số của sóng hình sin, 휃 xác định chọn lọc hướng của hàm và 휑 độ lệch chuẩn của đường bao Gauss. Phát hiện cực trị không gian theo tỉ lệ Được sử dụng trên tất cả các tỉ lệ và vị trí hình ảnh. Dựa trên hàm DoG để xác định các điểm quan tâm nổi bật không thay đổi theo tỉ lệ và hướng. Dữ liệu đầu vào được chuyển thành không gian 퐿(푥, 푦, 휎) như sau: 퐿(푥, 푦, 휎) = 푔(푥, 푦, 휎) ∗ 퐼′(푥, 푦), trong đó ∗ tương ứng với toán tử tích chập, 퐼′(푥, 푦) là hình ảnh đầu vào được xử lý trước và 푔(푥, 푦, 휎) là một hàm Gaussian với băng thông 휎. DoG được định nghĩa như sau: 퐷(푥, 푦, 휎) = (푔(푥, 푦, 푘휎) − 푔(푥, 푦, 휎)) ∗ 퐼′(푥, 푦) 59 = 퐿(푥, 푦, 푘휎) − 퐿(푥, 푦, 휎). Định vị điểm chính Một mô hình chi tiết phù hợp để xác định vị trí và tỉ lệ của từng vị trí nổi bật. Phép nội suy được thực hiện bằng cách sử dụng hàm Taylor bậc hai của hàm không gian tỉ lệ DoG 퐷(푥, 푦, 휎) với điểm chính nổi bật là điểm gốc. Hàm Taylor này như sau: 휕퐷푇 1 휕2퐷 퐷(푋) = 퐷 + + 푥푇 푥 휕푥 2 휕푥2 Trong đó điểm cực đại và điểm cực tiểu của 퐷 và các đạo hàm được đánh giá tại điểm nổi bật và 푥 = (푥, 푦, 휎) là phần bù từ điểm này. Xác định hướng Sử dụng 16 hướng cho mỗi vị trí điểm chính dựa trên các hướng gradient của hình ảnh cục bộ. Đối với mẫu hình ảnh 퐿(푥, 푦) ở tỉ lệ 휎, cường độ gradient, 휃(푥, 푦) và hướng, 푚(푥, 푦), được xử lý bằng cách sử dụng sự khác biệt về pixel 퐿(푥, 푦 + 1) − 퐿(푥, 푦 − 1) 휃(푥, 푦) = 푡푎푛−1 ( ) 퐿(푥 + 1, 푦) − 퐿(푥 − 1, 푦) Bộ mô tả điểm chính Xung quanh mỗi điểm chính, các gradient cục bộ được đo đã chọn để thu được 푀 vectơ bộ mô tả (푑푖)푖=1 với 푀 điểm chính. Khi các điểm chính được rút trích, hình ảnh truy vấn sẽ được so khớp và so sánh với từng đặc trưng được rút trích với các hình ảnh tương ứng trong cơ sở dữ liệu đăng ký (từ các bộ đặc trưng huấn luyện). Người xác thực đánh giá số lượng giữa một câu hỏi và hình ảnh huấn luyện. Gọi 퐿 (푑푡)푀 và (푑푞) lần lượt là tập các bộ mô tả điểm chính huấn luyện và câu hỏi. 푖 푖=1 푖 푗=1 Khoảng cách giữa các bộ mô tả điểm nổi bật được tính từ giá trị sau: 푡 푞 2 퐷푑(푖, 푗) = ‖푑푖 − 푑푖 || 60 푡 Trong đó ‖∙|| là chuẩn Euclide. Xác định sự phù hợp giữa điểm huấn luyện 푑푖 푞 và điểm chính 푑푖 được hỏi khi 퐿 1.5퐷푑(푖, 푗) < 푚푖푛 = {퐷푑(푖, 푗)}푛=1 với 푛 ≠ 푗. Ngưỡng được ước tính trong giai đoạn huấn luyện và không nhạy cảm với các giá trị trong khoảng 1,2-1,7. Xác thực so khớp Việc xác nhận điểm phù hợp cho các quyết định xác thực là phổ biến trong một số phương pháp khai thác đặc trưng sinh trắc học khác. Xác nhận dựa trên khoảng cách tọa độ giữa các điểm chính để cải thiện hiệu suất SIFT trên sinh trắc học bảng màu không tiếp xúc. Giả thuyết là tọa độ từ hai điểm chính được so khớp phải giống 푡 nhau nếu hiệu chỉnh độ dịch chuyển trung bình từ tất cả các điểm so khớp. Gọi 푐푖 = 퐿 {푥푡, 푦푡}푀 và 푐푞 = {푥푞, 푦푞} lần lượt là tập các tọa độ trọng tâm huấn luyện và nghi 푖 푖 푖=1 푖 푖 푖 푖=1 vấn. Khoảng cách giữa các tọa độ được tính như sau: 푡 푞 2 퐷푐(푖, 푗) = ‖푐푖 − 푐푖 || Trong đó ‖∙|| là chuẩn Euclide. Xác định sự phù hợp giữa điểm chính huấn 푡 푞 luyện 푐푖 và điểm chính 푐푖 được hỏi khi 푀 1.5 2 퐷 (푖, 푗) = ∑‖푐푡 − 푐푞‖ 푐 푀 푖 푗 푖=1 Do phương sai hình dáng cao trong chụp ảnh không tiếp xúc, sử dụng hệ số trọng số 1,5 để điều chỉnh các lỗi căn chỉnh nhỏ giữa các lòng bàn tay. Số so khớp tối đa giữa bộ câu hỏi và tập huấn luyện là điểm tương đồng. Nếu điểm tương đồng lớn hơn một ngưỡng, hình ảnh được hỏi sẽ được xác thực. 61 CHƯƠNG 3 PHƯƠNG PHÁP ĐỀ XUẤT 3.1 Ý tưởng Phương pháp đề xuất bao gồm ba bước: (1) trích xuất đường đặc trưng bằng bộ lọc MFRAT, (2) áp dụng phương pháp ECS-LBP để phát hiện các đường vân mạch máu lòng bàn tay ổn định và rõ ràng; và (3) rút trích đặc trưng cục bộ bất biến SIFT trên hình ảnh đường vân mạch máu lòng bàn tay (Hình 3.1). Palm MFRAT- vein MFRAT ECS-LBP SIFT EL-SIFT image fearture Hình 3.1 Sơ đồ của phương pháp đề xuất. 3.2 Thuật toán 3.2.1 Bộ lọc dựa vào phép biến đổi radon sửa đổi (MFRAT) MFRAT được đề xuất để kết nối các vân đứt gãy với nhau. Hơn nữa, bộ lọc này được sử dụng để tăng tính đối xứng tuyến tính của các đường gờ để bộ lọc đối xứng tuyến tính có thể được sử dụng để xác định các chi tiết nhỏ trong các khu vực thiếu đối xứng tuyến tính. Đề xuất sử dụng bộ lọc này giúp loại bỏ bớt nhiễu, làm tăng độ chính xác, tính ổn định trong nhận dạng vân mạch máu lòng bàn tay. 3.2.2 Thuật toán mẫu nhị phân cục bộ đối xứng (CS-LBP) CS-LBP so sánh các cặp pixel đối xứng tâm (Hình 3.2a). Độ mạnh trên các vùng ảnh phẳng thu được bằng cách lập ngưỡng chênh lệch mức xám với một giá trị nhỏ T như được đề xuất trong [18]: 푁 ( ⁄2)−1 푖 퐶푆 − 퐿퐵푃푅,푁,푇(푥, 푦) = ∑ 푠 (푝푖 − 푝 푁 ) 2 , 푖+( ⁄2) 푖=0 1 푥 > 푇 푠(푥) = { (2) 0 표푡ℎ푒푟푤푖푠푒 62 Trong đó 푝푖 và 푝 푁 tương ứng với các giá trị màu xám của các cặp pixel 푖+( ⁄2) đối xứng tâm của N pixel cách đều nhau trên một vòng tròn bán kính R. CS-LBP có liên quan chặt chẽ với toán tử gradient, vì giống như một số toán tử gradient, nó coi sự khác biệt mức xám giữa các cặp pixel đối diện trong một vùng lân cận. 3.2.3 Phương pháp ECS-LBP để cải thiện các mẫu vân mạch máu lòng bàn tay Hình 3.2 (a) Đặc trưng CS-LBP với 8 điểm lân cận và (b) Đặc trưng ECS-LBP với 16 khối lân cận (các khối bao gồm 4 điểm) Tương tự như phương pháp tăng cường LBP [38], tăng cường CS-LBP (ECS- LBP), sửa đổi phiên bản CS-LBP, tính toán các giá trị đặc trưng từ các khối (tập hợp điểm) thay vì các điểm cô lập. Đặc trưng ECS-LBP được tạo theo cách tương tự như thuật toán CS-LBP như sau: Tham số là giá trị màu xám trung bình của các cường độ pixel lân cận của điểm (Hình 3.2b). Tương tự với CS-LBP, và tương ứng với các cặp pixel đối xứng tâm của N pixel cách đều nhau trên một vòng tròn bán kính R. Lưu ý rằng có thể xem xét một số cấu trúc liên kết tập hợp điểm có kích thước khác nhau để nắm bắt thông tin kết cấu khác nhau. Trong phương pháp này, các hình vuông có kích thước 2 × 2, được sử dụng. 63 3.2.4 Phương pháp EL-SIFT để phát hiện các đặc trưng chính của vân mạch máu lòng bàn tay và so khớp Đặc trưng SIFT là bộ mô tả nổi tiếng nhất sử dụng gradient làm đặc trưng cục bộ. SIFT là một phương pháp mạnh mẽ để phát hiện các đặc điểm hình ảnh cục bộ bất biến đối với tỉ lệ hình ảnh, dịch và xoay [40]. Các đặc trưng này có được bằng cách chọn các vị trí chính cực đại cục bộ và cực tiểu của sự

Các file đính kèm theo tài liệu này:

bao_cao_nghien_cuu_khoa_hoc_nhan_dang_van_mach_mau_long_ban.pdf