Công nghệ

 

Nhận diện khuôn mặt hiện là một trong những ứng dụng gần gũi nhất của Thị giác máy tính. Công nghệ này được tích hợp trên đa thiết bị, đa nền tảng, đa lĩnh vực, đem đến cho người dùng cuối những trải nghiệm nhanh chóng, tiện lợi và vẫn đảm bảo an toàn khi tiến hành xác thực trên các hệ thống. Vậy liệu bạn đã biết các phương pháp kỹ thuật đứng đằng sau công nghệ nhận diện khuôn mặt? Bài viết dưới đây sẽ chỉ ra các phương pháp chính để xây dựng mô hình nhận diện khuôn mặt. 

Geometric Based / Template Based (Cách tiếp cận dựa trên hình học / khuôn mẫu)

Thuật toán nhận dạng khuôn mặt được phân loại là thuật toán dựa trên hình học hoặc dựa trên khuôn mẫu (geometry based hoặc template based algorithms). Các phương pháp dựa trên khuôn mẫu có thể được xây dựng bằng cách sử dụng các công cụ thống kê như SVM [Support Vector Machines], PCA [Principal Component Analysis – Phân tích thành phần chính], LDA [Linear Discriminant Analysis – Phân tích phân biệt tuyến tính], phương pháp Kernel hoặc Trace Transforms. Các phương pháp dựa trên đặc điểm hình học phân tích các đặc trưng khuôn mặt và mối quan hệ hình học của chúng. Đây còn được gọi là phương pháp dựa trên đặc trưng.

Piecemeal / Wholistic (Cách tiếp cận một phần/toàn bộ khuôn mặt)

Mối quan hệ giữa các thành phần hoặc giữa một thành phần với toàn bộ mặt, nhiều nhà nghiên cứu đã theo cách tiếp cận này, cố gắng suy ra các đặc điểm phù hợp nhất. Một số phương pháp sử dụng mắt, hay kết hợp nhiều yếu tố khác nhau, v.v. Một số phương pháp Hidden Markov Model cũng thuộc loại này, và xử lý đặc trưng được biết đến phổ biến trong nhận dạng khuôn mặt.

Appearance-Based / Model-Based (Cách tiếp cận dựa trên hình dáng / mô hình)

Phương pháp dựa trên hình dáng sử dụng các phương pháp hình thái học kết hợp với phân tích từ mô hình học máy để xác định trực tiếp vị trí của các vùng có khuôn mặt trong ảnh. Mỗi hình ảnh được coi là một vectơ nhiều chiều. Kỹ thuật này thường được sử dụng để lấy không gian đặc trưng từ việc phân chia hình ảnh. Hình ảnh mẫu được đối chiếu với tập huấn luyện. Phương pháp dựa trên hình dáng có thể được phân loại là tuyến tính hoặc phi tuyến. Ví dụ: PCA, LDA, IDA được sử dụng trong phương pháp tiếp cận tuyến tính, trong khi Kernel PCA được sử dụng trong phương pháp tiếp cận phi tuyến. 

Bên cạnh đó, cách tiếp cận dựa trên mô hình hướng tới việc mô hình hóa một khuôn mặt. Mẫu mới được triển khai cho mô hình và các thông số của mô hình được sử dụng để nhận dạng hình ảnh. Phương pháp dựa trên mô hình có thể được phân loại là Đối sánh đồ thị co giãn đàn hồi 2D hoặc 3D (2D or 3D Ex- Elastic Bunch Graph Matching).

Template / Statistical / Neural Networks based (Cách tiếp cận dựa trên mẫu/thống kê/mạng thần kinh)

Template Matching (Đối sánh mẫu)

Trong đối sánh mẫu, các đặc trưng được thể hiện bằng mẫu (sample), mô hình, pixel, kết cấu, v.v. Chức năng nhận dạng thường là một phép tính tương quan hoặc khoảng cách.

Statistical Approach (Phương pháp tiếp cận thống kê)

Trong cách tiếp cận Thống kê, các mẫu được biểu thị dưới dạng các đặc trưng. Mỗi hình ảnh đại diện liên quan đến một đặc trưng. Vì vậy, mục tiêu là lựa chọn và áp dụng công cụ thống kê phù hợp để khai thác và phân tích.

Có nhiều công cụ thống kê được sử dụng để nhận dạng khuôn mặt, bao gồm:

Phân tích thành phần chính [PCA]

Một trong những phương pháp thống kê được sử dụng và trích dẫn nhiều nhất là Phân tích thành phần chính. Quy trình toán học thực hiện giảm chiều bằng cách trích xuất thành phần chính của dữ liệu đa chiều.

Giảm chiều từ hình ảnh 3D sang 2D

Biến đổi Cosin rời rạc [DCT]

Phương pháp này biểu thị một loạt các điểm dữ liệu liên quan đến tổng các hàm cosin và các tần số dao động khác nhau. DCT dựa trên biến đổi rời rạc Fourier và do đó, bằng cách nén các biến thể, nó có thể được sử dụng để biến đổi hình ảnh và cho phép giảm chiều hiệu quả.

Phân tích phân biệt tuyến tính [LDA]

LDA được sử dụng rộng rãi để tìm ra sự kết hợp tuyến tính của các đặc trưng trong khi vẫn bảo toàn khả năng phân tách lớp. Không giống như PCA, LDA cố gắng mô hình hóa sự khác biệt giữa các cấp độ. Đối với mỗi cấp độ, LDA thu được sự khác biệt trong vectơ chiếu.

Phép chiếu bảo toàn tính cục bộ [LPP]

LPP là giải pháp thay thế tốt nhất của PCA để bảo tồn cấu trúc và thiết kế cục bộ. Các thuật toán nhận dạng mẫu thường tìm kiếm mẫu gần nhất hoặc các vùng lân cận. Vì vậy, việc cục bộ duy trì chất lượng của LPP có thể giúp đẩy nhanh tốc độ nhận diện.

Gabor Wavelet

Các tế bào đơn giản trong vỏ não thị giác có thể được xem như một họ các wavelets 2D Gabor tự giống nhau. Bộ lọc Gabor có khả năng phân tích hình ảnh tương tự hệ thống thị giác của con người, chủ yếu dựa vào việc chủ động kiểm soát hướng của cạnh để trích xuất đặc trưng.

Phân tích thành phần độc lập [ICA]

ICA nhằm mục đích biến đổi dữ liệu dưới dạng kết hợp tuyến tính của điểm dữ liệu độc lập về mặt thống kê. Do đó, mục tiêu của nó là cung cấp một biểu diễn hình ảnh độc lập thay vì tương quan. ICA là một giải pháp thay thế cho PCA, cung cấp khả năng biểu diễn dữ liệu mạnh mẽ hơn. 

Kernel PCA

Scholkopf và cộng sự đã giới thiệu việc sử dụng các hàm Kernel để thực hiện PCA phi tuyến tính. Phương pháp luận cơ bản của nó là áp dụng ánh xạ phi tuyến cho đầu vào và sau đó giải một PCA tuyến tính trong không gian con đặc trưng thu được.

Mạng thần kinh (Neural Networks)

Mạng thần kinh tiếp tục sử dụng kĩ thuật nhận dạng và phân loại mẫu. Kohonen là người đầu tiên chỉ ra rằng một mạng nơ-ron có thể được sử dụng để nhận dạng các khuôn mặt đã căn chỉnh và chuẩn hóa. Có nhiều phương pháp khác nhau hỗ trợ trích xuất đặc trưng bằng mạng nơ-ron. Các phương pháp này, kết hợp với các công cụ như PCA hoặc LCA, tạo ra một bộ phân loại kết hợp để nhận dạng khuôn mặt. 

 

Mạng thần kinh sâu để nhận dạng khuôn mặt

Mạng thần kinh với Bộ lọc Gabor

Thuật toán nhận dạng khuôn mặt bằng cách triển khai perceptron nhiều lớp, kết hợp với thuật toán lan truyền ngược (back-propagation). Đầu tiên, có một bước tiền xử lý. Mỗi hình ảnh được chuẩn hóa theo các pha của độ tương phản và độ sáng. Sau đó, mỗi hình ảnh được xử lý thông qua một bộ lọc Gabor. Bộ lọc Gabor có năm tham số định hướng và ba tần số không gian, do đó có 15 bước sóng Gabor.

 

Mạng thần kinh với Bộ lọc Gabor

Mạng thần kinh với mô hình Markov ẩn

Mô hình Markov ẩn là một công cụ thống kê hỗ trợ nhận dạng khuôn mặt, được sử dụng kết hợp với mạng nơ-ron. Nó được tạo ra trong một mạng nơ-ron đào tạo HMM 2D giả. Đầu vào của quá trình 2D HMM này là đầu ra của ANN, và nó cung cấp cho thuật toán khả năng giảm chiều thích hợp.

Mạng thần kinh mờ

Mạng nơ-ron mờ hỗ trợ nhận dạng khuôn mặt được giới thiệu vào năm 2009. Hệ thống này sử dụng perceptron nhiều lớp. Các vectơ đặc trưng thu được bằng cách sử dụng biến đổi bước sóng Gabor.

Thông tin chi tiết vui lòng liên hệ:

Công ty Cổ phần tư vấn giải pháp Công nghệ CSTSOFT

Địa chỉ: 192 Lê Trọng Tấn - Hà Nội

Số điện thoại: 098 913 8873

Email:support@cstsoft.net