Nghiên cứu và ứng dụng trí tuệ nhân tạo (AI) thường liên quan đến việc xây dựng và đào tạo mạng thần kinh sâu (deep neural networks). Trước khi liquid neural networks xuất hiện, tất cả các hệ thống học sâu này đều có chung một nhược điểm: chúng học một ánh xạ cố định từ dữ liệu đầu vào đến dự đoán đầu ra, do đó, không thể đáp ứng với sự thay đổi của môi trường.
Hơn nữa, hầu hết các mô hình học sâu đều độc lập và không phụ thuộc vào ngữ cảnh. Ví dụ: khi áp dụng mô hình phân loại hoặc phát hiện đối tượng cho video, video sẽ được xử lý từng khung hình mà không dựa vào ngữ cảnh xung quanh.
Để khắc phục hạn chế này, các kỹ sư AI thường thu thập những bộ dữ liệu quy mô lớn, mang tính đại diện và thực hiện quá trình học chủ động (active learning) nhằm liên tục cải thiện hệ thống thông qua các chu kỳ đào tạo lại khi phát hiện những trường hợp mới.
Quy trình học chủ động. Nguồn ảnh: Towards Data Science
Tuy nhiên, quy trình trên đòi hỏi phải tiến hành gán nhãn, đào tạo và triển khai lại, do đó, tốn nhiều thời gian và nguồn lực. Trong tình huống này, còn gì tuyệt vời hơn là một mô hình biết học cách thích ứng với những tình huống mới?
Đây là lúc Liquid Neural Network xuất hiện. FriData sẽ cùng bạn khám phá “bí mật” đằng sau sự ưu việt của Liquid Neural Network trong thị giác máy tính nhé!
Liquid Neural Network là một dạng recurrent neural network (mạng thần kinh hồi quy – RNN) xử lý dữ liệu theo chuỗi thời gian. RNN đã chứng minh được hiệu suất mạnh mẽ và khả năng dự đoán dựa trên các chuỗi như luồng văn bản hoặc chuỗi thời gian của các phép đo khoa học.
Kiến trúc mạng thần kinh hồi quy. Nguồn ảnh: Towards Data Science
RNN vượt quá hiệu suất của các mạng thần kinh truyền thẳng (feedforward neural networks) thông thường khi dữ liệu đầu vào là một chuỗi. Bởi lẽ, RNN có thể theo dõi thông tin liên quan ở các phần khác nhau của chuỗi một cách hiệu quả.
Liquid Neural Network được xây dựng dựa trên RNN bằng cách tạo các trạng thái ẩn thay đổi theo hằng số thời gian trong chuỗi thời gian. Ở mỗi bước, Liquid Neural Network tính toán cả kết quả dự đoán cũng như sự hình thành trạng thái ẩn tiếp theo phát triển theo thời gian.
Thuật toán Liquid Neural Network. Nguồn ảnh: Towards Data Science
Liquid Neural Network được chứng minh là cải thiện mô hình chuỗi thời gian ứng dụng ở nhiều lĩnh vực khác nhau, chẳng hạn theo dõi cử chỉ, hoạt động của con người, sự thay đổi của hệ thống giao thông, năng lượng, ôzôn. Những kết quả ban đầu hứa hẹn tiềm năng triển khai Liquid Neural Network trong thực tế.
Mục tiêu dài hạn của Liquid Neural Network là hình thành một hệ thống linh hoạt theo bối cảnh và thời gian, cuối cùng thậm chí không cần phải cải tiến liên tục thông qua học chủ động.
Về lâu dài, các kiến trúc như Liquid Neural Network có thể cải thiện đáng kể khả năng đào tạo các mô hình thích ứng (resilient models) trong xử lý video, khiến chúng trở nên linh hoạt hơn trước các biến đổi của môi trường.
Tuy nhiên, tác động của Liquid Neural Network đối với thị giác máy tính còn là một chặng đường dài. Các thử nghiệm ban đầu trong kho lưu trữ Liquid Neural Network đều dựa trên chuỗi thời gian, không dựa trên hình ảnh và video.
Processed files: 1. Vectorial velocity of left hand (x coordinate) 2. Vectorial velocity of left hand (y coordinate) 3. Vectorial velocity of left hand (z coordinate) 4. Vectorial velocity of right hand (x coordinate) 5. Vectorial velocity of right hand (y coordinate) 6. Vectorial velocity of right hand (z coordinate) 7. Vectorial velocity of left wrist (x coordinate) 8. Vectorial velocity of left wrist (y coordinate)
Ví dụ về dữ liệu chuỗi thời gian trong Liquid Neural Network
Như vậy, Liquid Neural Network là một bước đột phá mới trong RNN, tạo ra một mô hình áp dụng linh hoạt theo thời gian. Tuy nhiên, nghiên cứu đang được tiến hành và có thể sẽ mất một thời gian trước khi chúng ta thấy được tác động của các mạng này đối với lĩnh vực thị giác máy tính.
Thông tin chi tiết vui lòng liên hệ:
Công ty Cổ phần tư vấn giải pháp Công nghệ CSTSOFT
Địa chỉ: 192 Lê Trọng Tấn - Hà Nội
Số điện thoại: 098 913 8873
Email:support@cstsoft.net